前言:中文期刊网精心挑选了监督分类范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
监督分类范文1
针对基于图的半监督流形正则化图像分类算法需要大量无标记样本训练分类器,空间和时间复杂度高,甚至不能处理大规模图像,且对背景或目标复杂的图像分类错误率较高的问题,提出了结合均值漂移(mean shift)的基于图的半监督流形正则化图像分类算法。该方法对基于图的半监督流形正则化分类算法的改进主要体现在两方面,首先是通过mean shift算法对图像进行了平滑,以平滑后的图像作为分类对象;其次不是利用所有无标记样本,而是只采用少量无标记样本。实验结果表明:图像的平滑使得目标和背景区域的特征更为一致,从而利用较少的样本就可以提高分类器的正确率;同时大大降低了算法的复杂度,使得基于图的半监督分类算法用于分类大规模图像成为可能。
关键词: 基于图;半监督;流形正则化;均值漂移;图像分类
中图分类号:TP391.41
文献标志码:A
0引言
在解决模式识别和机器学习的分类问题中,半监督学习受到关注。半监督学习[1]旨在运用少量标记样本和大量未标记样本建立分类器,通过利用隐含于未标记样本中的关于数据分布的更多信息来提高分类器性能。
基于图的半监督图像分类技术是近年来图像分类领域的一个新的研究热点,已有很多基于图的半监督图像分类的方法[1-6]并且在一些图像上取得了好的分类效果。该类方法建立在图论基础上[7-15],将图像映射为无向加权图,在此图上构造目标函数f来实现分类,目前已提出很多方法[6-7,9-11],这些方法的差异体现在构造f的不同。在对图像分类过程中,这些算法需要较多的样本才能训练得到准确率较高的分类器,较多训练样本使算法的时间复杂度和空间复杂度随之增加,甚至内存溢出。本文在以下方面做出改进以解决上述问题,利用mean shift算法[16]平滑原始图像,再运用基于图的半监督流形正则化算法对平滑后图像进行分类。因为平滑后的图像特征多样性降低,在训练时只随机选择50个已标记样本和100个未标记样本训练分类器,这样算法时间复杂度和空间复杂度都降低了。平滑后的图像去除了相邻相似特征区域中的跳跃点和噪声,而且mean shift平滑算法可以很好地保留边缘,因此在训练样本很少的情况下提高了分类正确率。实验结果验证了所提方法的有效性和高效性,适于解决大规模复杂图像的分类问题。
4实验结果及分析
程序在Matlab2010b环境中编写,在内存为1GB,CPU为Intel Core 6320,频率为1.86GHz的机器上运行。实验用图都是从Weizmann horse dataset[18]中选择的。图2(a)马5为加噪声密度为0.05的椒盐噪声,并且Weizmann horse dataset已经给出了理想的分类效果图,可以用来评价分类结果。本文采用像素分类正确率(Pixel Classification Rate, PCR)评价分类效果。
5结语
本文将mean shift算法和半监督流形正则化方法结合起来实现图像分类。该方法首先通过mean shift算法平滑图像,使图像呈现区域状,区域内部特征一致,然后以平滑后的图像为初始图像,仅用少量标记样本和无标记样本训练分类器,再采用基于图的流形正则化算法求解。实验结果显示,本文算法的分类正确率比LapRLS算法高,并且降低了算法复杂度。今后的研究将考虑选择对分类能提供更多有用信息的未标记样本,如位于目标边界上的未标记样本,以期基于较少的无标记样本得到有效且高效的半监督分类方法。
参考文献:
[1]ZHU X J. Semisupervised learning literature survey [EB/OL].[20120805].http://pages.cs.wisc.edu/~jerryzhu/pub/ssl_survey.pdf.
[2]BLUM A, CHAWLA S. Learning from labeled and unlabeled data using graph mincuts[C]// Proceedings of the Eighteenth International Conference on Machine Learning. New York: ACM Press, 2001:19-26.
[3]SZUMMER M, JAALLOLA T. Partially labeled classification with Markov random walks[C]// Proceedings of Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2002: 945-952.
[4]ZHOU D Y, BOUSQUET O, LAL T N, et al. Learning with local and global consistency[C]// Proceedings of the 18th Annual Conference on Neural Information Processing System. Cambridge: MIT Press, 2003: 321-328.
[5]BELKIN M, NIYOGI P, SINDHWANI V. Manifold regularization: a geometric framework for learning from labeled and unlabeled examples [J]. Journal of Machine Learning Research, 2006, 7(11):2399-2434.
[6]SMOLA A J, KONDOR R. Kernels and regularization on graphs[M]. Berlin: Springer, 2003: 144-158.
[7]LUO Y. Manifold regularized multitask learning for semisupervised multilabel image classification [J]. IEEE Transactions on Image Processing, 2013, 22(2):523-536.
[8]BIJRAL A S, RATLIFF N, SREBRO N. Semisupervised learning with density based distances [EB/OL].[20121010]. http://ttic.uchicago.edu/~nati/Publications/SemiSupDBD.pdf.
[9]ZHU X J, GHAHARMANI Z, LAFFERTY J. Semisupervised learning using Gaussian fields and harmonic functions [C]// Proceedings of the 20th International Conference on Machine Learning. Menlo Park: AAAI Press, 2003:912-919.
[10]WU M R, SCHOLKOPF B. Transductive classification via local learning regularization [C]// MEILA M, SHEN X. Proceedings of the 11th International Conference on Artificial Intelligence and Statistics. Cambridge: MIT Press, 2007: 624-631.
[11]WANG F. A general learning framework using local and global regularization [J]. Pattern Recognition, 2010, 43(9):3120-3129.
[12]GONG Y C, CHEN C L. Graphbased semisupervised learning with manifold preprocessing for image classification[C]// Proceedings of 2008 IEEE International Conference: Systems, Man and Cybernetics. Piscataway, NJ: IEEE Press, 2008: 391-395.
[13]LIU W, HE J F, CHANG S F. Large graph construction for scalable semisupervised learning[EB/OL].[20121010]. http://machinelearning.wustl.edu/mlpapers/paper_files/icml2010_LiuHC10.pdf.
[14]ZHU X J. Semisupervised learning with graphs [D]. Pittsburgh, Pennsylvania: Carnegie Mellon University, 2005.
[15]GOMEZCHOVA L. Mean map kernel methods for semisupervised cloud classification [J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(1):207-220.
[16]COMANICIU D, MEER P. Mean shift: a robust approach toward feature space analysis [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(5): 603-619.
[17]BORENSTEIN E. Weizmann horse database [DB/OL]. [20120805]. http:///people/members/eranb/.
[18]TAO W B, JIN H, ZHANG Y M. Color image segmentation based on mean shift and normalized cuts [J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, 2007, 37(5):1382-1389.
监督分类范文2
1行政执法主体方面的案例
案例一:案例描述:某县档案局在年终工作总结中写道:一年来,为落实《档案法》及其实施办法、《河南省档案工作条例》,促进全县档案事业的健康发展,我局先后联合县委办公室、县人大办公室等部门,组成档案行政监督检查组,对全县的档案管理情况进行了2次联合检查,共查处档案违法行为18起,并对7起较为严重的档案违法行为下发了《责令限期改正通知书》,及时纠正了个别单位在档案管理中的违法行为,有力地促进了全县档案事业的健康发展。存在问题:县委办公室、县人大办公室是档案行政监督检查的主体吗?案例评析:依据我国法律规定,行政执法必须由行政执法主体来执行。那么,何为行政执法主体呢?根据行政法学原理,所谓行政执法主体,是指依法成立并享有国家行政执法权力,能以自己的名义从事行政执法活动,能独立承担由此而产生的法律后果的机关或者组织。国务院印发的《全面推进依法行政实施纲要》(以下简称《纲要》)将此类机关和组织分为三类:一是行政机关;二是经法律、法规授权的非行政机关的组织;三是经行政机关委托的非行政机关的组织。《纲要》明确提出,要建立健全行政执法主体资格制度,行政执法由行政机关在法定职权范围内实施,非行政机关的组织未经法律、法规授权或者行政机关的委托,不得行使行政执法权。本案例中,某县档案局联合县委办公室、县人大办公室组成档案行政监督检查组,查处档案违法行为的具体行政行为,明显是一种档案行政执法具体行政行为。根据行政法学原理和《纲要》要求,上述三个执法主体必须是档案行政主体,或者必须经法律、法规的授权。那么,县委办公室、县人大办公室是否具备上述条件呢?首先看地方人大是否具备上述条件。根据《地方各级人大组织法》的相关规定,地方各级人大是地方的最高权力机关,不是权力执行机关,也就是说不是行政主体。虽说其具有保证档案法律、法规贯彻执行的监督职能,但这种监督职能是法制监督,是对权力执行机关的监督,不是对具体行政相对人的监督,不具有对行政相对人实施具体行政执法行为的资格。再看地方党委是否具备上述条件。按照我国政治体制原则,地方党委是地方各项事业的领导机关,是党团组织,其领导职责主要是方针政策、组织上的领导,并不是行政主体,也不具备法律、法规所规定的行政执法主体资格。综上所述,地方党委、人大既不是档案行政管理的行政主体,也不是法律、法规授权进行档案行政执法的执法主体。案例中,县委办公室、县人大办公室是县委、县人大的内部协调办事机构,其机构性质从属于县委、县人大,自然也不是档案行政执法的主体,不具备档案行政执法的主体资格。其直接参与档案行政监督检查的做法,是与法律的规定和《纲要》的要求相背离的,是一种无效的行为。
案例二:案例描述:2006年7月,某县档案局法制科电话通知所辖各乡镇,为加强汛期档案安全保管,确保档案安全度汛,县档案局法制科将组织人员对全县所有乡镇综合档案室档案保管情况进行监督检查。检查中发现有两个乡镇综合档案室库房存在漏雨现象,当即下发了《责令限期改正通知书》,要求这两个乡镇在15天内改善库房保管条件,确保档案安全,并将整改情况书面报档案局法制科。《责令限期改正通知书》落款是某县档案局法制科,并加盖了某县档案局的公章。存在问题:某县档案局法制科是档案行政监督检查的主体吗?案例评析:按照行政法学理论和法律、法规规定,行政机关必须依法设定,是重要的行政主体,代表国家或地方独立进行行政管理。行政机关的内设机构是行政机关的内部组成部分,虽然具体履行着行政机关的职能,但其并不是行政主体,没有对外的行政管理权,也不对外承担相应的法律责任。在具体的行政监督检查活动中,行政机关的内设机构可以代表行政机关进行执法,但只能以行政机关的名义进行,而不能以内设机构自己的名义擅自作出。由此可见,行政机关的内设机构非经法律、法规的授权,是不具有行政执法主体资格的。本案例中,某县档案局法制科制发的《责令限期改正通知书》虽然盖的是档案局的公章,但其电话通知、《责令限期改正通知书》落款均是法制科,应视为此次行政监督检查是法制科以自己的名义做出的具体行政行为。而法制科是档案局的内设机构,按照法律、法规的规定,依法不具有对外进行档案行政监督检查的职权,也不具有进行档案行政监督检查的主体资格,因此,某县档案局法制科以自己名义进行的档案行政监督检查和制发的《责令限期改正通知书》,是违法的行政行为和无效的执法文书。
2行政执法人员方面的案例
案例三:案例描述:河南省某县档案局、馆合署办公,是县委、县政府直属的文化事业单位,履行全县档案事务的行政管理和全县档案的安全保管双重职能。局馆共有工作人员13名。其中,只有甲、乙、丙三人通过考试取得了行政执法资格,拥有省人民政府统一颁发的《行政执法证》。在每年例行的档案行政监督检查中,该县档案局一直采取由甲、乙、丙三人分别带队,另外调配其他三名工作人员,组成三个监督检查组(每组两人)的形式开展档案行政监督检查工作。存在问题:其他三名工作人员参加行政监督检查组合法吗?案例评析:根据行政法学原理,行政执法工作必须由具有行政执法资格的工作人员来履行,不具备行政执法资格的人员不得从事行政执法工作。河南省《〈行政执法条例〉实施办法》(以下简称《办法》)规定,行政机关应当按有关规定对行政执法人员进行培训,定期考核,经考核不合格者不得上岗执法。经考试和考核合格,取得《河南省行政执法证》的,方可上岗执法;未经执法培训或者经考试、考核不合格,未取得《河南省行政执法证》的,不得上岗执法。而河南省人民政府《关于实行持证上岗亮证执法的通告》(以下简称《通告》)则更明确地规定,《执法证》是行政执法人员行使执法权的资格证明。未依法取得《执法证》的,无权从事行政执法工作。从上述行政法学原理和河南省的地方法规、规章规定看,行政执法是一种职务行为,只有具备行政执法资格的工作人员,才可以进行行政执法活动。不具备行政执法资格的工作人员从事行政执法工作,则是一种不合法的职务行为,应当严令禁止。本案例中,另外调配的其他三名工作人员与具备行政执法资格的甲、乙、丙三人搭配,组成档案行政监督检查组,虽然符合每次档案行政监督检查不得少于两人的规定,但是,另外调配的其他三名工作人员既没有接受过行政执法培训,也没有取得《办法》规定的行政执法资格和《河南省行政执法证》,按照该省《通告》的规定,另外调配的其他三名工作人员是不具备从事行政执法资格的人员,无权在其辖区内从事档案行政监督检查工作。由此可以看出,某县档案局由甲、乙、丙与不具备行政执法资格的其他三名工作人员组成档案行政监督检查组的做法是错误的。
3档案行政相对人适格方面的案例
案例四:案例描述:某县档案局在例行档案行政监督检查时,发现人民银行某县支行1992年~2000年的文书档案没有依法向该县档案馆移交。该支行不移交档案的理由是:人民银行是金融特殊行业,实行行业垂直管理,保密性强,按照上级规定,其档案不移交当地档案馆。监督检查人员要求该支行提供不移交档案的上级行文件规定。该支行提供不出具体文件。监督检查人员合议后认为:该支行提出的不移交理由不成立。按照《档案馆通则》和《各级国家档案馆收集档案范围的规定》,该支行的文书档案属于向该县档案馆移交范围内的档案,应当依法按时移交。责令该支行立即纠正错误做法,并据此下达了《责令限期改正通知书》。《责令限期改正通知书》中写道:人民银行××县支行档案室:2013年9月13日上午10点,我局对贵档案室进行了例行监督检查,经检查发现,贵档案室保管的1992年~2000年的文书档案没有依法向××县档案馆移交(具体案卷情况见《清查档案清单》),此行为违反了《档案馆通则》和《各级国家档案馆收集档案范围的规定》的有关规定,特责令贵档案室在一个月内(2013年9月13日~2013年10月13日)纠正违法行为,依法向××县档案馆移交附件《清查档案清单》中的档案,并将整改情况书面报××县档案局。人民银行××县支行接《责令限期改正通知书》后,经请示其上级行郑州分行和济南中心行后,按时移交了应移交的档案。存在问题:某县支行档案室是档案行政管理机关的行政相对人吗?
案例评析:行政主体和行政相对人是构成行政法律关系的主体,双方相互作用,促使行政法律关系的产生、变更和消灭。基于行政法律设定条件的行政关系主体,是一种相对稳定和平衡的法律关系。只有当行政主体就是法律所规定的对行政相对人发生作用的“那个”行政主体,行政相对人是法律所规定的行政主体必须针对的“那个”行政相对人时,行政法律关系才能实现相对的稳定。行政相对人包括个人或组织,在行政法律关系中,行政相对人与行政主体相对应而存在,是行政法律关系中的重要“一极”。如果一个行政法律关系中的所谓“行政相对人”并不是法律所规定的行政主体可以或者必须针对的当事人,则这个行政法律关系就可能立即崩溃。换句话说,就是行政执法中,行政主体找错了对象,虽然也在行政主体与错误的对象之间产生了行政法律关系,但这种行政法律关系的稳定性却是无法保证的。如果行政执法中张冠李戴,就意味着对行政相对人主体的认定不合法律规定,意味着整个行政执法行为认定事实不清,属于违法行为。《中华人民共和国档案法》第六条第二款规定:县级以上地方各级人民政府的档案行政管理部门主管本行政区域内的档案事业,并对本行政区域内机关、团体、企业事业单位和其他组织的档案工作实行监督和指导。由此可以看出,基于《档案法》基础上的档案行政法律关系,其档案行政主体是各级人民政府的档案行政管理部门,其行政相对人是本行政区域内的机关、团体、企业事业单位和其他组织。具体到本案例中,档案行政监督检查的主体是某县档案局,其针对的“行政相对人”应该是人行某县支行,而不是人行某县支行档案室。人行某县支行档案室作为该行的内设职能机构,可以代表该行行使其一定的职能活动,但不具有机构法人地位,不能成为某县档案局档案行政监督检查的“行政相对人”。其职能活动当中产生的法律责任只能由具备机构法人资格的人行某县支行承担。案例中,某县档案局监督检查人员制作的《责令限期改正通知书》,将人行某县支行档案室认定为“行政相对人”的做法,属于张冠李戴,认定事实不清的违法行为。
4行政执法程序方面的案例
案例五:案例描述:2009年6月20日,河南某县档案局行政执法人员张某、刘某到所辖乡镇监督检查2008年文件归档情况。张某、刘某来到C镇时,负责C镇档案工作的主管领导镇党委办公室主任吴某接待了他们。执法人员张某与吴某相互认识,双方相互寒暄后,吴某向张某、刘某介绍了该镇2008年文件归档的大致情况。随后,吴某陪同张某、刘某对该镇档案室2008年文件归档情况进行了现场检查。检查中发现,该镇文件归档不全,缺少2008年的《干部职工统计年报》、《党员统计年报》、党委会议记录等应归档的文件材料。现场检查结束后,张某、刘某向吴某和档案员通报了现场检查情况,要求将缺少的《干部职工统计年报》、《党员统计年报》、党委会议记录等应归档的文件材料收集齐全,及时归档。存在问题:张某、刘某进行的此次监督检查程序是否完善?
案例评析:行政执法程序是指行政执法的管辖、过程、步骤、顺序、时限、方式等内容和环节的总称。程序正当是依法治国对行政机关依法行政提出的最基本要求。其主要作用是:规范行政执法行为,防止行政执法的随意性;保障行政相对人参与国家行政管理,监督和制约行政机关依法办事;协调行政机关和行政相对人的关系,达到消除对立情结、构建和谐社会的目的。虽然我国还没有制定一部完整的行政执法程序法律,但各单行法律、法规和规章中对行政执法的程序性规定,无疑是行政执法中应当严格遵守的原则。行政法学原理将各单行法律、法规和规章中有关程序性的规定归纳为以下几种:一是执法公开制度;二是表明身份制度,三是告知制度;四是听取陈述和申辩制度;五是听证制度;六是回避制度;七是时效制度;八是说明理由制度;九是调查取证制度;十是行政执法文书制度。在具体的行政执法实践中,行政机关和行政执法人员必须按照相关单行法律、法规和规章规定的执法程序进行执法活动,否则,就会造成执法程序违法,承担因程序违法而造成的法律后果。本案例中,张某、刘某进行的此次监督检查违反了表明身份的程序规定。按照行政法学原理,出示证件,表明身份是行政执法的重要环节和步骤,凡是与行政相对人直接打交道的行政执法活动,都要遵守、不得省略。不出示证件表明身份的,属程序违法,行政相对人有权拒绝。河南省人民政府《关于实行持证上岗亮证执法的通告》也规定:《执法证》是行政执法人员行使执法权的资格证明。行政执法人员开展行政执法工作,必须向公民、法人或其他组织出示《执法证》,以表明身份。不出示《执法证》表明身份的,属于行政执法程序违法的行为,公民、法人或其他组织有权拒绝,并有权向县级以上人民政府法制机构投诉,也可以向人民法院。案例中,虽然张某与吴某相互认识,也不能违反法律、法规和规章所规定的程序,否则,一旦有不良后果出现,就会造成此次档案行政监督检查行为程序违法,使档案局陷入被动局面。此外,该案例中,张某、刘某进行的此次行政监督检查,没有制作《现场监督检查记录》,没有将C镇文件归档不齐全的违法事实记录固定下来,也是一种不符合行政执法程序的违法行为。
5行政执法文书方面的案例
案例六:案例描述:某县档案局在对该县林业局进行例行监督检查时发现,有3卷涉及机构编制、干部职工年报、花名册的永久卷不知去向,查阅该局《档案借阅登记本》,也没有此3卷档案的借阅登记记录。询问档案员时,档案员也说不出档案的确切去向。据此,某县档案局当即对林业局下发了《责令限期改正通知书》,要求该林业局在15天内追查出档案的去向,并将追查结果书面报告县档案局。逾期不报追查结果,将立案查处,追究有关人员的行政责任。在规定的整改期限内,该林业局书面答复称:去向不明的3卷永久档案,系该局会计在办理局机关人员工资调整时借出,遗忘在了县财政局工资福利股,现已收回,并对相关人员进行了批评教育。存在问题:此次行政监督检查的执法文书完善吗?案例评析:行政执法文书是行政机关在行政执法活动中制作的,用以记载和证实行政执法过程的各种材料,是记录行政执法过程情况、认定事实、内容的法律文书载体。根据行政法学原理,在具体的行政执法活动中,有些具体的违法事实,在没有书证、实物、影像的情况下,必须通过制作相应的行政执法文书,来记载违法事实的情况,使违法事实得以固定,以支撑行政执法后续行政处理的开展。制作行政执法文书,也是行政执法程序不可缺少的重要环节。只有完备的行政执法文书,行政执法的过程才能完善,才能善始善终。
监督分类范文3
北京开元策略信息咨询有限公司于2007年3月、6月、9月、12月对北京、上海、广州、深圳报刊零售终端进行抽样调查,对于2007年度时尚男士类杂志零售市场检测情况结论如下:
一、 2007年度时尚男士类杂志零售市场份额对比分析
开元策略2007年时尚男士类杂志市场份额分布如上图所示:
从开元2007年四个季度调查结果显示:《男人装》在时尚男士类杂志零售市场份额领先优势较为明显,其是零售市场份额排名第二的二倍,高于其他杂志更多,属于零售市场的领跑者。
《时尚先生》和《时尚健康(男士)》市场份额比较接近,其低于《男人装》而较其他男士类杂志高得多。
其他时尚男士类杂志如《风度》、《青年视觉》等零售市场份额均低于10.00%。
时尚男士类杂志各季度零售市场份额对比
从开元各季度数据对比情况上看:
《男人装》零售市场份额较为平稳,尽管在三季度下降至32.44%,但四季度零售市场份额为36.45%,回归趋势明显。
《时尚先生》和《时尚健康(男士)》,这两种杂志零售市场份额四季度变化也不大,总体上看,这两本时尚男士类杂志市场份额均较为接近,《时尚先生》略显优势。
《男人志》和《大都市(男士版)》在2007年各季度零售市场份额均呈现递增趋势。
二、 四大中心城市平均实销量对比图
从开元策略对四大中心城市平均实销量对比情况上看:《男人装》在北京,《新视线》和《名牌》在广州,而《大都市(男士版)》在上海区域优势较为明显,零售平均实销量较其他三个城市更高。
三、 时尚男士类杂志2007年季度变化趋势图
监督分类范文4
[论文关键词]法律监督 内部关系 概念
一、法律监督内部关系的概念
“法律监督内部关系”一词,可以从两个层面来理解。一是指法律监督各项权能之间的关系。法律监督各项权能共同构成法律监督职能,是法律监督职能的具体内容,它们之间的关系自然属于法律监督内部关系的范畴。二是指法律监督主体之间的关系,是检察系统内部各功能主体在履行法律监督职能中或者为了保障和促进法律监督职能而形成的关系。这两层涵义是有联系的。法律监督各项权能之间的联系直接决定和影响了法律监督各主体之间的关系,或者说,法律监督各主体之间的关系,应当由法律监督各项权能之间的客观联系所决定,理应是对它的全面反映。从这个角度来说,两层涵义本质上具有一定的同一性。不过从本文写作的目的来说,从第二个层面来界定法律监督内部关系更为恰当。因为法律监督各项权能之间的联系最终仍然要通过构建合乎其要求的主体关系来实现。此外,主体关系的构建不仅仅要考虑权能之间的客观联系,而且要考虑更多的要素,这些要素虽然与权能之间的联系无关,但是对权能的有效发挥有着不容忽视的作用。据此,本文中的法律监督内部关系一词采用第二个层面的涵义。
这一涵义包括了以下两层内容:
1.法律监督关系是指检察系统内部各个功能主体之间的关系。主体是一个含义十分复杂的词语,在不同的学术领域有着不同的内涵。如在哲学领域,主体是相对于客体的一个概念,是指在事物之间发生联系的过程中,起主动作用的事物。法学中的主体是与法律关系一词紧密联系的,确指法律关系中的人。如在行政法关系中,行政行为的发出者和接受者都是行政法律关系的主体。本文中的主体并不考虑上述两个层面的意义,而是特指所有的检察机关、检察机关的业务部门(机构)和监督管理部门以及这些部门内的职能人员。
2.法律监督关系是指各个功能主体之间在履行法律监督职能过程中或者为了保障、实现法律监督职能而产生的关系。每一个功能主体在对外履行法律监督职能时,难免要与其他的主体发生关系,比如下级与上级、侦查与批捕,等等。为了确保法律监督职能的有效实施,在检察系统内部还存在对职能部门进行监督和管理的部门,它们之间也会发生一定的关系。这两类关系是法律监督内部关系的实际内容。
学术领域对每一个概念的界定都与界定者的研究目的与研究范围直接关联,本文的这种界定也是由本文的写作任务和目的决定的。本文的出发点不是要从一个超然的角度来阐述、介绍或者评价检察系统的内部关系,而是要研究如何使法律监督主体与法律监督职能更为完美地结合到一起,换言之,就是要研究解决如何更好地促进检察系统提升整个系统的法律监督能力,更好地履行法律监督的职能。而一个系统能力的提升不仅仅取决于单个个体的能力,同时取决于多种内部结构与关系的协调和处理。正是这些对于更好地履行法律监督职能来说是必须解决和协调的关系组成了法律监督内部关系的外延,这也是笔者对法律监督内部关系进行上述定义和界定的理由和根据。这同时也体现了研究法律监督内部关系的重要意义。
二、法律监督内部关系的分类
由于主体的多样性和复杂性,内部关系成为一个庞大而复杂的系统,不同主体之间的关系往往既有相同性或者相似性,又有差异性。据此,对主体进行分类,以此作为进一步分析和归纳的前提和基础,是十分必要的。为此笔者进行了四个向度的分类:
(一)第一个向度的分类依据是内部关系的现实性程度。据此内部关系可以分为两大类:1.应然关系。本文中的应然关系又包括两种类别,第一种是从社会发展和有效履行法律监督职能的客观要求出发得出的应然关系,不妨称其为理想型关系;第二种是综合上述客观要求、当前的客观实际状况即实现要求的客观条件得出的应然关系,不妨称其为现实型关系。2.实然关系,即当前内部关系的实际状况。
(二)第二个向度的分类依据是发生关系的主体之大小,此时内部关系可以分为四大类:1.个体与部门、机关之间的关系;2.部门之间的关系;3.部门和机关之间的关系;4.机关之间的关系。
(三)第三个向度的分类依据是发生关系的主体之级别,此时内部关系可以分为两大类:1.级别相同的主体之间的关系;2.级别不同的主体之间的关系。
(四)第四个向度的分类依据是主体之间发生关系的时点。此时内部关系可以分为三大类:1.履行法律监督职能之前发生的关系;2.履行法律监督职能之中发生的关系;3.履行法律监督职能之后发生的关系。
上述四种不同分类下产生的类别关系之间又存在着复杂的联系。一是彼此在外延上往往存在交叉。如机关之间的关系既可能是履行职能之前发生的关系,也可能是之中、之后发生的关系;既可能是同级之间的关系,也可能是不同级别之间的关系。二是不同的类别关系可能存在相同或相似的处理原则和方式,比如上下级机关之间的关系与同职能的上下级部门之间的关系处理原则是相同或相似的。三是同一类别关系中不同主体之间关系的处理原则也可能存在差异。比如同是上下级部门关系,侦查职能部门与其他职能部门的上下级关系在处理原则上就存在差异。
总之,内部关系是一个十分复杂的系统,一方面需要我们条分缕析,具体问题具体分析,另一方面又需要我们归纳、整理和概括,对共性的东西进行归类和抽象。为此,根据上述分类,笔者拟定了如下的行文思路:以对理想型应然关系的研究为起点,通过对实然关系的调查和分析,最终
探讨和构建现实型应然关系。以第二种分类产生的四种关系作为分析各种内部关系的基本框架,在对每一种关系的分析中,再根据第三、第四种分类对各种具体关系进行探讨。
三、衡量法律监督内部关系优劣的依据和标准
要探讨法律监督内部关系的应然模式,首先面临着一个问题:我们依据什么能够断定我们得出的这种模式就是法律监督内部关系的应然模式?这就如同我们判定一个党员应该做什么,不应该做什么,必然在先的要有一个标准和依据。笔者认为,判定某种模式是应然模式的依据在于:它能够使法律监督各项权能和谐且更好地得到履行,充分发挥其作用。因为检察机关和检察权的使命和设置的意义就在于强化法律监督,维护公平正义。这个依据和标准又可以具体分化为四个内涵:
(一)各项权能在运行中能够更好地实现社会和立法设置该项权能的目的
从人类历史来看,任何一项权力最初都是基于管理某种社会公共事务的需要而产生的。即是在奴隶社会和封建社会等集权时代,权力为私人所有,其管理和服务社会的性质也并没有被抹煞。相反,任何忽视了权力服务社会之客观任务和性质或者用权不慎的王朝,终会被社会和人民所抛弃。自资本主义社会以来,个人作为一级主体,通过古典个人主义的繁荣获得了与社会这一主体同等的地位与价值,权力的公益性和服务性在此基础上日益得到重视。每一项权力的设置都应该是为了管理或者解决某种公共事务,这是社会和立法设置该项权能的基本目的和出发点。权能得以更好履行的基本标志也就在于它能更好地实现社会设置它的目的和赋予它的任务。
(二)各项权能在实际运行中能够更好地提高工作效率
在现代社会,任何一项活动都需要具有效率观和效益观,司法活动也不例外。这作为法律监督权能履行得更好的标志,无需多言。
(三)各项权能之间能够实现一种有效的配合,形成一种高效的整体合力
与其他刑事机关不同的是,检察机关的法律监督权能具有多样性,从侦查、批捕到起诉,还有诉讼监督和职务犯罪预防。这些权能之间会存在某些联系,比如某种对立、制约或者互长关系等。如果能够认识到这些客观联系,在此基础上对各项权能进行组合和优化配置,即有可能形成一种高效的整体合力。通过这样的组合与配置,每一种权能将更好地发挥其作用。
(四)法律监督各项权能能够形成一种有效的监督与制约,形成一种良性的整体合力
监督分类范文5
关键词:数据流;半监督学习;集成分类;概念漂移;混合集成
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)34-7770-06
数据流分析和挖掘在数据挖掘和机器学习领域是一个具有挑战性的研究,它已经受到了计算机智能研究者的广泛关注[1-3]。与传统的静态数据相比,数据流具有动态性、高维度、实时性、无限性、顺序性和高速到达等特点[4],正是这些特点使得传统方法难以实现数据流的挖掘。而数据流分类是数据流挖掘的其中一种,它是从大量数据样本中提取知识和信息的过程,而这些样本中隐含的概念和知识可能随着时间和环境不断的发生变化,即存在的概念漂移[5]给研究带来了挑战。因此,一个高效的数据流分类算法需要在有限的时间和内存下以相当好的准确度完成任务,并且能够自适应地处理概念漂移。
在已有研究中,解决概念漂移问题的方法概括起来有三种[6]:实例选择、实例加权和集成学习。近年来研究最热的当属集成学习方法[7-9],它克服了运用滑动窗口方法参数难以确定的缺陷。尽管集成学习已经取得了相当客观的研究进展,但它是典型的有监督学习,需要大量的类标数据进行训练学习。而且标记数据是一个耗时又费力的工作,因此便有了近年来半监督学习的研究[10-12],它通过引入未标记数据来提高分类器的泛化性能。可以说近年来集成学习和半监督学习的研究都有了新的突破,但将两者融合来改善分类性能的研究还是凤毛麟角。2002年Bennett等人[13]提出使用标记和未标记数据共同构造集成分类模型,文中主要运用Boosting方法,它的缺点在于没有一种机制来控制对无类标数据标记的错误率;在文献[14]中Woolam等人融合半监督聚类和集成方法先将无类标数据进行标记,当标记数据占到一定比例时再对数据进行聚类,再运用类标传播技术为剩余无类标数据进行标记,最后更新集成分类器,这样当数据量很大时类标传播会耗费[Ο(n3)]的时间。
基于上述研究中存在的缺陷,该文将集成学习和半监督学习有效的融合,提出一种基于半监督学习的混合集成分类算法(Semi-Supervised learning Based Mixture Ensemble Classifier,SMEClass),由于引入未标记数据,使得集成分类器的准确性和泛化性都得到了改善,而且在对未标记数据进行标记时使用集成分类器和在数据块已有的类标数据集上训练的分类器一同进行多数投票,更增加了被标记数据的可信度。同时,在算法中也使用了概念漂移检测和噪声过滤的机制,以便能够更有效的适应含噪音和概念漂移的数据流分类。
1 SMEClass算法模型的训练和分类的流程
数据流分类挖掘面临着两大难题,一是概念漂移和噪音的影响,二是数据流实例标记的高额代价,很少有算法能高效地实现两者的兼顾,因此在标记样本少的情况下,既能兼顾概念漂移和噪音影响,又能确保分类的精度将是一个挑战,SMEClass能够解决这些问题,它假设数据流中的样本数据有一部分是随机标注的,然后使用我们的集成方法来对这些数据中的未标记实例进行标记,以增加分类的性能,而且在训练过程中进行了漂移监测和噪音过滤。
由于数据流的特性,在此算法中使用C4.5和Na?ve Bayes作为基础分类器来构建混合集成模型,在每个数据块上使用类似于self-training的方法来进行半监督学习。
首先对方法中涉及到的符号进行说明:如表1所示。
2 SMEClass算法
2.1算法的合理性论证
数据块到达后,用其中的有标记数据训练一个C4.5分类器,使用这个分类器和集成分类器一同对未标记数据进行预测,如果预测错误率小于随机错误率,则将这个预测类标作为此数据的类标记。在最坏的情况下,当有噪音实例时,如果拥有足够的类标数据,就能降低分类的错误率,为了达到这样的效果,借鉴了文献[16]中的思想。
2.2算法的执行过程
3 数据流变化的检测和识别
3.1概念漂移的检测
3.2噪声数据的过滤
为了降低噪音数据对概念漂移检测的影响,集成模型中增加了一个朴素贝叶斯分类器,这是因为Na?ve Bayes算法简单、速度快、准确率高,还有一个重要的特性就是对噪音数据相当敏感,利用它的统计特性,能够及时地发现数据中的噪音,以达到噪音过滤的效果。
使用这个计算方法,在[K+1]个分类器进行投票时,如果实例被一半以上的决策树分类器和Na?ve Bayes分类器同时分类错误,那么概念就存在潜在的漂移,将分类错误的实例放入缓冲区;反之,认为是噪音,不用其构建新的分类器,这样就减少了那些噪音数据对漂移检测的影响。
4 实验及结果分析
基于人工数据集、UCI提供的真实数据集和已有的半监督集成分类方法SEClass[15]进行对比测试。分别从算法的准确率、运行时间和可扩展性三个方面验证SMEClass方法的有效性。实验运行环境为:1.73GHz英特尔奔腾双核PC机,1GB内存,Windows XP操作系统。
为了实现算法,在实验中使用MOA平台,SMEClass的参数设置如下:[K=8](基分类器个数),[d=5000](数据块大小);SEClass参数如下:[L=8](基分类器个数),[K=50](微簇个数),[M=5000],[e=0.9]。采用先测试再训练的顺序,这样可以有效显示模型的泛化能力。
人工数据集包括HyperPlane、Random RBF、Random Tree、SEA和Waveform。具体构造见文献[9],真实数据集采用UCI提供的Forest Covertype。
表2显示了数据集的相关信息,这里对数据集分成大小固定为1000的数据块,使他们分批到达来模拟数据流的特性。
4.1 算法准确率分析
算法的准确率如表3所示,由于现实生活中获得已标记数据代价太大,在实验数据集中我们只利用[20%]的已标记数据,其余[80%]的数据是未标记的,而且在实验过程中增加了噪音数据和噪音属性,以测试SMEClass算法对噪音数据的过滤能力和对含噪音属性数据集的学习能力。
由于文献[15]中有两个属性权值处理方式,SEClass-I在训练中不调整属性权值,SEClass-II在训练迭代过程中动态调整属性权值,通过对比实验结果可以发现SMEClass和SEClass-II的准确率较高,由于SEClass-II动态调整属性权值可以减少噪音属性的影响,而SMEClass是采用的C4.5决策树分类模型,也能实现这一点,叶节点在分裂的过程中会选择具有最大增益率的属性进行分裂,这样每次都能选择最重要的属性。而且SMEClass采用的贝叶斯分类器还能够有效降低噪音数据对准确度的影响,而SEClass没有考虑噪音数据的影响,因此在同时含有噪音属性和噪音数据的情况下,SMEClass的分类准确率要略胜一筹。
4.2 算法的运行时间和可扩展性
在人工数据集Random RBF上测试SMEClass算法和SEClass算法,改变数据集的属性维度[d]来测试两个算法在高维数据情况下的运行时间,从而检验算法的可扩展性。实验结果如图2所示,纵坐标代表算法训练时间和测试时间之和。
观察实验结果,两个算法的运行时间都随属性量的增加呈线性增长趋势,这是因为在训练基本分类器和测试过程中他们都是和属性数量成线性关系的,但SMEClass的时间明显少于SEClass,这是因为SEClass算法在聚类过程中需要频繁计算实例间的距离,浪费了大量的时间,而SMEClass算法不存在这样的问题,因此在时间上有明显优势。这说明SMEClass算法在处理高维数据流时比较稳定,具有良好的可扩展性。
5 结束语
针对数据流类标数据获取困难这一现状,该文提出将集成学习和半监督学习有效结合的一种分类算法SMEClass,算法在数据块上采用类似于self-training的学习方法将置信度高的无类标数据赋予标记后加入类标集来改善基分类器的性能,由于在标记过程中使用了集成分类器的多数投票机制,这使加入的无类标数据更加可靠,而且增加了一个Na?ve Bayes分类器用来去除数据所含噪音,及时更新集成分类器以适应概念漂移。
实验表明,与基于聚类的半监督数据流集成分类算法SEClass相比,SMEClass算法具有更高的准确度和较强的抗噪性,而且免去了存储大量微簇的空间,且运行时间随属性维度的增加呈现线性增长,具有一定的可扩展性,因此本文的算法能够用于高维数据流分类问题。
参考文献:
[1] Liao S H,Chu P H,Hsiao P Y.Data mining techniques and applications-A decade review from 2000 to 2011[J].Expert Systems with Applications, 2012,39(12):11303–11311.
[2] Read J, Bifet A,Holmes G,PfahRINGER B.Scalable and efficient multi-label classification for evolving data streams[J].Machine Learning,2012,88 (1-2),243–272.
[3] 白雪冰,王宝军.数据流分类算法分析[J].电脑知识与技术,2012,8(11):2445-2446.
[4] Zliobaite I.Learning under concept drift:an overview[R/OL].Technical report,Vilnius University,2009.http:///pdf/1010.4784v1pdf.
[5] Widmer G,Kubat M.Learning in the presence of concept drift and hidden contexts[J].Machine Learning ,1996,23(1):69-101.
[6] Ho S-s,Wechsler H. A Martingale framework for detecting changes in data streams by testing exchange ability[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(12):2113-2127.
[7] Scholz M,Klinkenberg R.An Ensemble Classifier for Drifting Concepts[C]//Proceedings of the 2nd International Workshop on Knowledge Discovery in Data
Streams.Portugal:Porto,2005:53-64.
[8] Aggarwal C C,Han J,Wang J Y,et al.A Framework for On-Demand Classification of Evolving Data Streams[J].IEEE Transactions on Knowledge and Data Engineering,2006,18(5):577-589.
[9] Bieft A,Holmes G,Pfahringer B,et al.New Ensemble Methods for Evolving Data Streams[C]//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Ming.France:Paris,2009:139-148.
[10] Chapelle O,Scholkopf B,Zien A,editors.Semi-Supervised Learning[M].Cambridge:MIT Press,2006.
[11] Zhu X.Semi-supervised learning literature survey [R/OL].Technical Report 1530, Department of Computer Sciences,University of Wisconsin at Madison,2006.http://cs.wisc.edu/jerryzhu/pub/ssl_survey.pdf.
[12] Zhou Z H,Li M.Semi-supervised learning by disagreement[J]. Knowledge and Information Systems,2010,24(3):415-439.
[13] Bennett K,Demiriz A,Maclin R.Exploiting unlabeled data in ensemble methods[C]//Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Canada:Edmonton,2002:289–296.
[14] Woolam C,Masud M M,Khan L.Lacking Labels in the stream:Classifying evolving stream data with few labels[J].Foundations of Intelligent Systems,2009,5722:552-562.
[15] 徐文华,贾征,常扬.基于半监督学习的数据流集成分类算法[J].模式识别与人工智能,2012,25(2):292-299.
监督分类范文6
关键词:半监督学习; 多标记分类问题; 局部学习; 标记; 正则项
中图分类号:TP391.4
文献标志码:A
Semi-supervised multi-label classification algorithm based on local learning
L Jia*
College of Computer and Information Sciences, Chongqing Normal University, Chongqing 400047,China
Abstract:
Semi-supervised multi-label classification problem is usually decomposed into a set of single-label semi-supervised binary classification problems. However, it results in the ignorance of the inner relationship between labels. A semi-supervised multi-label classification algorithm was presented, which avoided multiple single-label semi-supervised binary classification problems but adopted the overall approach in this paper. On the basis of undirected graph, local learning regularizer for data points and Laplace regularizer for labels were introduced and regularization framework of the problem was constructed. The experimental result shows the proposed algorithm has higher precision and recall.
英文关键词 Key words:
semi-supervised learning; multi-label classification problem; local learning; label; regularizer
0 引言
多标记学习起源于文本分类研究中遇到的歧义性问题,主要解决一个样本可以同时属于多个类别的问题。现实世界中,多标记学习问题普遍存在[1],例如,在生物信息学中,一个基因序列具有若干个功能,如“新陈代谢”、“蛋白质合成”等;在文本分类中,每篇文档可能同时属于多个主题,如“苹果”、“乔布斯”等;在场景分类中,每个场景图片可能对应于多个类别,如“大海”、“沙滩”等。通常多标记分类问题的一种直观的处理办法是把多标记分类问题转化为一组独立的二类分类问题,其中每一个二类分类问题对应一个标记,每一个样本的标记最终通过组合所有的二类分类问题的结果获得[2]。这种处理方法的好处在于可以利用最新的二类分类算法,缺点是它是孤立地处理分解得到的每一个二类分类问题,未考虑到每个样本所属类标记集中类与类之间的相关性。而在实际问题中,如能充分利用类与类之间的相关性,则可有效地提高学习系统的泛化能力。研究者们已开始考虑样本所属类标记集中类与类之间的相关性的问题[3-4]。进一步地,在多标记分类问题中考虑无标记样本,这就是半监督多标记分类问题。将半监督学习引入多标记学习中,可以降低多标记学习在应用中的成本,使得仅需标注少量的样本,得到更好的学习效果。其中,比较具有代表性工作的有:Liu等[5]提出了一种半监督多标记学习框架,根据输入空间和输出空间的相似性,把半监督多标记学习问题转换为约束非负矩阵因式分解的问题。该方法有效地利用了无标记样本提供的信息,并且考虑了类与类之间的相关性,在训练样本数相对较少时分类效果也很好。陈钢等[6]同时考虑无标记样本和类与类之间相关性两方面的内容,在训练样本和类标记上分别创建了无向图,构建了基于图的正则化框架。再通过求解Sylvester方程来获得无标记样本的标记。孔祥南等[7]利用直推式多标记分类(Transductive multi-label classification, TRAM)方法为每一个训练样本分配一组多标记,首先构造直推式多标记学习的优化问题来估计类标记构成,接着推导出该优化问题的闭型解,最后运用一种有效的算法给未标记样本分配标记集。本文以“整体法”来研究半监督多标记分类问题,利用局部学习来习得样本类标记,利用流形学习来考虑类别与类别之间的相关性,提出了基于局部学习的半监督多类分类算法,实验证明了算法的可行性和有效性。