前言:中文期刊网精心挑选了姐姐的菊花蕾范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
姐姐的菊花蕾范文1
关键词:半监督学习;二分类问题;全局正则化;局部正则化;平滑
中图分类号: TP18;TP391.4;TP301.6文献标志码:A
Semi-supervised binary classification algorithm based on
global and local regularization
英文作者名L Jia1,2,3*
英文地址(1. School of Mathematical Sciences, Inner Mongolia University, Hohhot Nei Mongol 010021, China;
2.College of Computer and Information Science, Chongqing Normal University, Chongqing 400047, China;
3.College of Science, China Agricultural University, Beijing 100083, China)
Abstract: As for semi-supervised classification problem, it is difficult to obtain a good classification function for the entire input space if global learning is used alone, while if local learning is utilized alone, a good classification function on some specified regions of the input space can be got. Accordingly, a new semi-supervised binary classification algorithm based on a mixed local and global regularization was presented in this paper. The algorithm integrated the benefits of global regularizer and local regularizer. Global regularizer was built to smooth the class labels of the data so as to lessen insufficient training of local regularizer, and based upon the neighboring region, local regularizer was constructed to make class label of each data have the desired property, thus the objective function of semi-supervised binary classification problem was constructed. Comparative semi-supervised binary classification experiments on some benchmark datasets validate that the average classification accuracy and the standard error of the proposed algorithm are obviously superior to other algorithms.
Key words: semi-supervised learning; binary classification problem; global regularization; local regularization; smooth
0引言
在解决机器学习和模式识别中的分类器学习问题时,通常根据训练样本的类标号是否参与训练而将学习分成三类:训练样本类标号要参与训练的,称之为有监督学习[1-2];训练样本类标号不参与训练的,称之为无监督学习[3];部分样本的类标号参与训练的,称之为半监督学习[4-5]。在实际应用中,获取大量有标记数据通常费时且代价较高,例如Web文本分类中[6],很容易收集到Web网页,但标记不同的网页为对应的主题却费时费力,因此旨在从大量无标记样本和少量有标记样本中学习的半监督学习在理论及实际应用中得到了极大关注。
到目前为止,已有许多研究学者提出了各种半监督学习算法,其中大部分算法都属于基于图的方法[7-12],通过估计一个以所有样本为节点、样本相似性为边的权重构成的图上的函数f来实现分类, f要求同时满足以下条件:一是应该与其相邻有标记样本的标记接近;二是应该在整个图上光滑。文献[7]提出一种基于Gaussian随机域和谐波函数的算法(即基于拉普拉斯正则项方法(Lap_Reg))来平滑无标记样本的标记信息;文献[8]首次提出一种基于全局流形的正则化方法来学习无标记样本的类标号;文献[9]提出一种基于局部和全局一致性的算法,该算法利用基于正则化拉普拉斯正则项方法(NLap_Reg)在数据流形上得到无标记样本的类别;文献[10]提出利用样本的邻居样本的信息来学习得到该样本类标号的基于局部学习正则项方法(LL_Reg);文献[11]提出利用局部样条回归方法来构建半监督分类算法;文献[12]提出了一种通用的局部和全局正则化框架用来解决无标记样本的类标号标注问题,以上算法实际上都是基于正则化框架下的半监督学习算法,目标函数由损失函数和正则项构成,它们的区别在于选择不同的损失函数和正则项。
本文在总结和分析上述各种方法的基础上,在半监督二分类问题的目标函数中同时加入全局正则项和局部正则项,提出了一种结合全局和局部正则化的半监督二分类算法。实验结果证明了本文算法的正确性和可行性。
1半监督二分类问题
6结语
本文提出的结合全局和局部正则化的半监督二分类算法利用局部正则项使得最优解具有理想的性质,利用全局正则项来弥补局部正则项因邻域内样本较少可能导致的学习不充分的问题,从而平滑类标号。数值实验结果表明,与基于拉普拉斯正则项方法、基于正则化拉普拉斯正则项方法和基于局部学习正则项方法相比,本文算法分类精度更高。下一步工作将把全局正则项和局部正则项应用到半监督多类分类问题以及半监督多标记分类问题中。
参考文献:
[1]邓乃扬,田英杰. 数据挖掘中的新方法――支持向量机 [M]. 北京:科学出版社,2004.
[2]邓乃扬,田英杰. 支持向量机: 理论、算法与拓展 [M]. 北京:科学出版社, 2009.
[3]吕佳. 基于动态隧道系统的K-means聚类算法研究 [J]. 重庆师范大学学报:自然科学版,2009,26(1):73-77.
[4]CHAPELLE O, SCHOLKOPF B, ZIEN A. Semi-supervised learning [M]. Cambridge: MIT Press, 2006.
[5]ZHU X J. Semi-supervised learning literature survey [EB/OL]. [2010-05-10]. pages.cs.wisc.edu/~jerryzhu/pub/ssl_survey.pdf.
姐姐的菊花蕾范文2
Abstract: Strength based sports event sportsman, especially female athletes often have the problem of anemia. Low hemoglobin levels represent a lower oxygen-carrying capacity which seriously affected athletes' health and teaching and training. Anemia could be divided into many types. Some are resulted by sports training which is called sports anemia and some is caused by physiological causes. If the treatment is not done according to the causes of anemia, it is impossible to effectively cure anemia. Through the examples and analysis, the paper tried to infer different kinds of anemia causes to help sportsman's treatment of anemia.
关键词:运动性贫血;发生机制;诊断
Key words: sports anemia; mechanism; diagnosis
中图分类号:G80-05 文献标识码:A 文章编号:1006-4311(2011)12-0271-02
0 引言
在一般运动队中,都会对运动员的血红蛋白HB、红细胞数RBC、红细胞压积HCT等血液生化指标进行定期检测,以监测运动员机能状态,防止贫血的发生。黑龙江女子马拉松运动员刘某冬训HB变化曲线,从进入冬训开始,该名运动员HB就接近于贫血标准,通过服用一些补血补剂后,症状并没有得到改善,究其原因,并没有诊断贫血种类而进行针对性治疗,因此,判断贫血的种类,对症治疗,才能较好的改善症状。
1 运动员中普遍存在的由各种原因导致的贫血现象
运动员经常出现贫血症状,其中大部分由过度训练造成,也有部分是由于生理原因导致的。过度的运动训练会影响血红蛋白的合成、铁需求量和流失的增加,有时还会有溶血现象,因此,由运动造成的贫血主要为缺铁性贫血、溶血性贫血等。由生理原因导致的贫血症状主要包括巨幼细胞性贫血和再生障碍性贫血等。
1.1 运动性溶血的发生原因 运动训练严重影响红细胞膜结构和变形能力。运动时,由于血糖下降,红细胞运氧速率加快等原因,会加剧红细胞膜的过氧化作用,红细胞能量供应不足,同时运动造成血液酸化、血浆渗透压改变及激素水平变化,所有这些原因共同导致红细胞膜流动性降低,膜变硬,变形能力显著下降,发生运动性溶血的机率大大增加。
1.2 过度训练导致缺铁性贫血的发生机制 运动员中经常发生缺铁性贫血,究其原因,可归结为铁流失量、需铁量较常人增多,铁吸收、摄入不足。运动员随着训练中汗液流失大量铁,特别是耐力性项目、女运动员和青少年运动员。此外有报道称,运动员的需铁量为常人的一倍,而铁的吸收仅为常人的二分之一。
2 根据几项简单血液生化指标间接判断贫血发生机制的方法
确定贫血的发生原因需要复杂的实验室操作或医学检查,而通过简单的血液常规指标就能大概的判断贫血种类,进而进行针对性治疗,或者也可以进一步有方向的进行诊断。
2.1 推断贫血种类的指标介绍 通常用来进行推断的依据指标有红细胞分布宽度RDW、红细胞平均容积MCV、红细胞平均血红蛋白量MCH和红细胞平均血红蛋白浓度MCHC等。这些指标的相关信息参照表1。
2.2 通过血液生化指标组合推断贫血种类的方法 根据部分血液生化指标的内在涵义,将它们组合就能很好的推断贫血的种类,表2介绍了根据指标高于或低于参靠范围的方法推断贫血种类的组合。
表3为节选的黑龙江女子中长跑运动员李某的L血常规检验单,从表中可以看出,该运动员RDW、MCV、MCH、MCHC等指标均低于正常范围,推断为缺铁性贫血,给予铁剂补充治疗2周后HB水平明显上升,一个月后达到正常水平。
2.3 贫血种类确诊的检验指标介绍 根据RDW、MCV、MCH、MCHC等反映红细胞形态的指标只能推断贫血的种类,而通过复杂的实验检验方法才能对贫血的种类进行确诊。临床出现缺铁性贫血表现时,一般体内会出现铁代谢的生化改变,通常通过实验室检测①血清铁蛋白(SF);②血清铁(SI);③血清总铁结合力(TIBC);④血清转铁蛋白(Tf);⑤转铁蛋白受体(TfR)等指标对缺铁性贫血进行最终的确诊。诊断溶血性贫血的项目主要有血清未结合胆红素检测、血清结合珠蛋白检测、网织红细胞计数以及一些特异性检验项目如抗人球蛋白试验、酸溶血试验等。巨幼细胞性贫血的发生机制在于体内对维生素B12及叶酸的缺乏造成的,对巨幼细胞性贫血的进一步实验室诊断项目一般为血清叶酸和维生素B12含量,以及骨髓检查等。