前言:中文期刊网精心挑选了全文检索范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
全文检索范文1
作者简介:张维刚(1980-),男,湖北咸宁人,讲师,博士研究生,CCF会员,主要研究方向:多媒体技术、信息检索; 徐永东(1974-),男,黑龙江鸡西人,副教授,博士,主要研究方向:自然语言处理、自动文摘; 雷小强(1986-),男,湖南耒阳人,硕士研究生,主要研究方向:信息检索; 何辉(1978-),男,山东济宁人,工程师,博士研究生,主要研究方向:可信计算、嵌入式计算。
文章编号:1001-9081(2011)08-02261-04doi:10.3724/SP.J.1087.2011.02261
(1.哈尔滨工业大学(威海) 计算机科学与技术学院,山东 威海264209; 2.华中科技大学 计算机科学与技术学院,武汉430074)
()
摘 要:为了更好地为Web站内检索提供服务,对Web全文检索的关键技术进行了研究,设计并实现了一个用于Web全文检索的中间件。该中间件通过多线程网页爬虫程序来抓取网页;对抓取结果采用基于Bloom-Filter的大规模URL去重算法来进行高效消重;应用所提出的新的基于标签的正文提取方法来进行网页正文提取,实验结果表明该正文提取方法是有效可行的;此外,为了改善用户的搜索体验,该中间件还提供了一些个性化搜索辅助功能。最后,实现了一个完整的博客搜索系统Boso(博搜)来验证中间件的性能,结果说明该中间件是可以投入实际应用的。
关键词:Web全文检索;中间件;URL去重;网页标签;正文提取
中图分类号: TP391.3文献标志码:A
Design and application of middleware for Web full-text retrieval
ZHANG Wei-gang1, XU Yong-dong1, LEI Xiao-qiang2, HE Hui1
(1. School of Computer Science and Technology, Harbin Institute of Technology at Weihai, Weihai Shandong 264209, China;
2. School of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan Hubei 430074, China)
Abstract: To provide better Web search services, the key techniques of the full-text retrieval were studied and a middleware was designed and implemented. By using a multi-thread website crawler program, the Web pages of the given URLs were collected. Bloom-Filter algorithm was employed to get rid of large-scale duplicate URLs in the collected Web pages. A new content extraction approach based on the Web tags was presented to extract the full-text content of Web pages for indexing and searching. The experimental results verify the efficiency of the content extraction method. Furthermore, to improve the search experience of users, many personalized search assistances were provided by this middleware. Boso, a blog search engine, was developed to test and verify the presented middleware. The results show that the presented middleware can be applied to actual search engines.
Key words: Web full-text retrieval; middleware; URL filter; Web tag; content extraction
0 引言
随着Web技术的迅速发展,信息量不断增大,如何快速准确地搜索到所需信息则成为亟须解决的问题。近十年来,随着搜索引擎技术的诞生和快速发展,传统的大型搜索引擎已经能够提供良好的大规模搜索服务。但是,这些大型引擎对于单一的或者某个特定的站点则显得不够精确。它们不关注深度遍历一个特定网站,因此很难提供优质的站内检索服务。此外,传统的大型搜索引擎更新速度较慢,因此给出的很多搜索结果并不是最新的网站页面。同时,由于站点内容及形式的多样性,传统搜索引擎难以控制输出。例如,按照某种特定规则进行检索结果排序等一些个性化操作在传统搜索引擎上则难以实现。
现在期望通过分析不同类型网站的网页布局特点,对网页数据源依次进行网页抓取、URL去重、正文提取等操作,并对提取结果建立索引,同时在应用层面上提供简单易用的程序接口,构建出Web全文检索中间件,就可以通过这个中间件来开发出满足个性化需求的Web站内全文检索服务来。这在实际应用中是非常有意义的。本文在这方面做了一些尝试工作。本文主要针对Web站内搜索问题,提出了一个Web全文检索中间件的架构模型;对中间件中所涉及的一些关键技术如多线程网页爬虫、大规模URL去重和正文提取等做了一些研究。特别是针对网页的正文信息,提出了一种新的基于标签的正文提取方法;利用这些关键技术,整合Lucene[1]工具包开发实现了一个Web全文检索中间件,并实现了一个完整的博客搜索系统――Boso来验证该中间件的性能。
1 全文检索中间件架构模型
图1给出了网站全文检索中间件的架构模型图。整个中间件由信息采集模块、信息处理模块和全文检索模块组成。各个模块的简要描述如下。
1)信息采集模块。该模块主要是负责对Web网页进行多线程抓取并对抓取所得到的URL进行去重处理。在该模块中,采集接口面向Web网站,只需给定抓取的起始URL,即可通过宽度优先搜索策略完成整个站点所有网页的抓取。
2)信息处理模块。该模块包含两个主要内容,一是对采集到的网页内容进行正文提取,采用所提出的基于标签的正文提取方法来实现;另一方面就是对提取结果进行分词并且建立索引,其中分词功能是通过使用中文分词组件JE-Analysis[2]来实现。
3)全文检索模块。全文检索模块提供了用户检索功能的接口,其内部封装了全文检索、用户检索条件解析、对检索结果进行排序以及若干提高用户体验的个性化操作功能,如搜索关键词智能提示、相关关键词搜索和高级检索等。
图1 Web全文检索中间件架构模型
2 关键技术
本文所提出的Web全文检索中间件用到的关键技术有:快速网页抓取,通过一个多线程的网页爬虫程序来自动快速抓取网页;大规模URL去重,使用Bloom-Filter对大规模URL进行去重,避免对相同网页重复抓取和处理;新提出的基于标签的正文提取方法,用于正确提取网页的正文内容和全文检索的实现。
2.1 多线程网页抓取
网页抓取是通过网页爬虫程序来实现的。为了提高搜索效率,爬虫被设计成多线程的。多个线程并发地在网络上协同工作,既可以充分利用网络宽带,又能够利用多线程的并发性来降低Internet高延迟的副作用,并发抓取网页。
网页爬虫采用宽度优先搜索策略。先搜索完一个Web页面中所有超链接,继而搜索下一层页面,直到底层为止。这就保证了对浅层的优先处理。当遇到一个无穷尽的深层分支时,也就不会陷进去出不来了。此外,宽度优先搜索策略还能在两个HTML文件之间找到最短路径。
在实现网页爬虫时,必须构建多个队列并根据不同状态进行队列选择:
1)等待队列。网页爬虫在解析HTML文件过程中会不断获取新的超链接,需要构建一个等待队列来保存这些超链接,以备后续网页的访问及抓取。
2)运行队列。由于采用多线程并发方式,因此需设计一个运行队列来保存当前正在运行的多个URL抓取动作。
3)错误队列。爬虫遇到网页抓取错误时,如正被抓取的网页不存在或多个网页链接构成环路导致进入死循环,则需去除此类链接,不再对它进行任何处理。这样,需要创建一个错误队列来保存这样的链接。
4)完成队列。为了避免对同一URL进行重复访问,一个用于保存已成功抓取过的URL队列是必不可少的。当爬虫访问一个新URL时,先查看URL完成队列,若该队列不包含此URL,则允许爬虫访问;否则跳过,进行下一个新URL的访问及抓取。
图2给出了上述四个队列的运行状态转换图。同一时刻一个URL只能处于一个状态。
2.2 大规模URL去重
文献[3]中通过维护两个队列来实现URL去重,但对于Hash函数的构造则采用传统MD5算法,数据量很大时,空间占用问题将成为瓶颈。本文使用Bloom-Filter[4]对大规模URL进行去重[5]。其核心思想是利用多个不同Hash函数来解决“冲突”。结合Hash表的数据结构,运用一个足够好的Hash函数将一个URL映射到二进制位数组中的某一位。这样就可以得到Bloom-Filter映射图,如图3所示。如果该URL所对应的二进制位值为1,则表示该URL已存在,可去重处理;否则,表明该URL不存在,应把对应位由0置为1,可进行网页抓取。
图2 状态转换示意图
图3 Bloom-Filter映射图
Hash存在一个冲突(碰撞)[5]的问题,用同一个Hash函数得到的两个不同URL的Hash值有可能相同。为了减少冲突,引入了多个Hash函数来对同一个URL计算多个Hash值。若其中有一个Hash值在映射图中所对应二进制位为0,那么该URL肯定不重复;只有当所有Hash值对应位为1时才表明该URL是重复的,应进行去重[6-8]。选择适当的Hash函数个数,就可使得碰撞发生概率降低到可以接受的程度。
在运用Bloom-Filter进行大规模URL进行去重时,每个URL都要计算多个Hash函数值,因此Hash函数的选择是很重要的。文献[9]评价了5种Hash函数,并对它们的URL映射性能进行了比较分析,结果显示Strhash和Tianlhash的性能较佳;文献[10]给出了两种针对URL散列性能很好的函数HfIp和Hf,并通过2000万URL的实验进行了评价。结果表明,HfIp是可靠的,并在北大天网搜索引擎系统中得到工程性的验证。因此在本文所描述的网站全文检索系统中也采用HfIp作为Hash函数。HfIp函数代码[10]描述如下:
unsigned int HfIp(char* url, int size) {
unsigned int n0;
char* b(char*)&n;
for (int i0; i
b[i%4]^url[i];
return n%size;
}
2.3 基于标签的正文提取
对于正文提取,文献[11]提出了一种基于统计的正文提取方法,在一定范围内能够较好地提取正文,但是其有一定的局限性,即只能针对Table布局的网页进行提取。文献[12]提出了一种基于包装器自动生成模板的正文提取方法,具有一定的通用性,但是鉴于网页的复杂性,该方法在准确率方面还有待提高。本文所新提出的基于标签的正文提取方法能够较好地提取网页的正文内容。
基于标签的正文提取方法主要有以下步骤。
1)首先用正则对HTML页面作初步处理,即去掉所有的修饰性标签如、等以及网页样式定义CSS代码或者引用JavaScript的标签和除正文外的超链接标签,正文中的超链接不能直接删除,将其格式化成“链接文本(超链接)”,这样能够正确反映原始网页正文的语义信息。
2)对于经过初步处理完后的HTML页面,就只剩下若干段可能包含正文的子HTML文本块。通过观察发现,剩下的子HTML文本块中,有两类显然不可能是网页正文,应去除。一类是大部分文字由超链接标签包围的说明性文字或者超链接文本内容构成(如类似于广告和图片的描述性内容,这些不能算作正文);另一类是文本块长度偏短即所包含的文字数偏少,也可认为不是网页正文。去除这两类子文本块后,就可以得到网页的候选正文块了。
首先去掉广告及图片说明类非正文子HTML文本块。具体的量化去除方法是统计出每个子文本块中超链接标签之外的所有汉字总数T,再统计出每个子文本块中被超链接标签所包围的说明汉字数量S;计算比值RT/S。如果R小于某个阈值K,则应去除。由于网页构成的多样性,阈值K的取值需要视具体测试对象而定。其次,要去除文字偏少的非正文HTML文本块。具体方法为:统计出子文本块中非网页标签包围的所有汉字字符总数也就是子文本块长度W。若W小于某个阈值N,则去除之。
3)从候选正文块中选择文字数最多也就是最长的子文本块作为整个HTML页面的正文,抽取出来用于后续处理。
基于标签的正文提取方法描述如下:
String getMainContent(s) {
输入字符串网页字符串s;
用正则表达式去掉一些无关标签,同时格式化超链接标签;
初始化一个保存子文本块集合的链表;
while(true) {
读入字符串s的下一个字符a;
if(a-1) {
提取结束;
break;
}
else if(a为开始标签)
push (a的位置);
else if(a为结束标签) {
pop (b);
strs.subString(b, a);
将子文本块str保存到链表;
}
}
移除链表中R小于阈值K和W小于阈值N的子文本块,链表中只剩下候选正文块;
对链表中剩余候选正文块按长度W值升序排列;
取链表最后一个元素也就是长度最长的候选正文块,去掉所有网页标签,作为网页正文输出;
}
针对基于标签的正文提取算法,为了验证其性能,取新浪博客.cn上所抓取的网页作为测试集做了实验。通过大量的对比实验,在最后的测试中取K为1。图4给出了基于标签的正文抽取算法的准确率P与阈值N之间的关系图。从图中可以看到,当阈值N选择在180左右时,正文抽取准确率最高。
表1给出了基于标签的正文提取算法在一些博客型网页上所取得的实验结果。其中,阈值K1,阈值N180。从表1可以看出,抽取.cn和的正文内容的准确率较高;而的准确率则较低,其主要原因是上的博客文字较少,也就是正文内容较少;其他的则比较均匀。总平均准确率为95.8%,这说明所提出的基于标签的正文提取算法是可行有效的。
图4 信息抽取阈值选择分布
表1 信息抽取实验结果
对于提取出的网页正文内容,借助于分词组件JE-Analysis[2],进行分词和构建索引。该JE分词组件提供了Lucene分词接口,支持分词粒度控制和英文、数字、中文混合分词,并能够自定义词库,分词速度较快,可以很方便集成到中间件中。此外,为了更好地改进用户的搜索体验,该中间件中还集成了一些个性化功能,如结果的相关度排序、时间排序、搜索关键词提示和高亮显示、检索结果数目预估、在初步搜索结果中再次细化检索等,多个搜索关键词之间还支持加(+),减(-)和非(~)运算。
3 博客搜索系统Boso
为了验证Web全文检索中间件的性能,本文开发实现了一个完整的博客搜索系统――Boso(博搜)。Boso系统能够针对博客网站给用户提供专门的内容搜索服务。Boso采用J2EE技术结合MVC架构,利用Web全文检索中间件,采用Java语言开发实现。图5给出了Boso的系统架构。
图5 Boso系统架构
1)表示层。用于生成用户访问的Web页面,包括博客搜索引擎的搜索界面、结果的返回页面、高级搜索页面,搜索引擎进行初始设置或者调整服务器功能的一些页面,都集中在表示层。简单地说,表示层就是该系统与各种用户的人机接口。
2)逻辑层。逻辑层位于系统的服务器端,包含众多的功能模块,是实现Boso和搜索服务功能的核心层次。表示层中提出的各种功能都通过逻辑层相应的代码模块实现。逻辑层的设计包含两个主要的内容:一是面向Internet的网页信息自动采集功能,通过一个专门的多线程爬虫程序来实现,并把采集的页面信息存储在下面的数据存储层中;另一个则是分析用户条件,进行组合搜索,将检索结果按照特定的缓存策略进行缓存,同时对给予用户展示的结果按照时间排序或者相关度排序。逻辑层的设计是实现系统健壮性、可重用性、可扩展性和可维护性的关键因素。
3)数据存储层。数据存储层主要是负责将网页爬虫采集到的HTML页面进行URL去重,然后用本文所描述的基于标签的正文提取方法对页面正文进行递归地提取,将提取结果封装成对象的形式,利用Lucene为其建立倒排索引,在索引文件中存储相应的数据。
图6给出了Boso的一次搜索界面截图。
图6 博客搜索系统Boso的检索结果截图
Boso系统还借助本文所述的Web全文检索中间件上的一些辅助的个性化功能如相关度排序、时间排序、搜索关键词提示和高亮显示和检索结果数目预估等来提供对应的更便捷的用户检索接口,来改善优化用户的使用体验。
4 结语
本文针对Web站内检索问题,提出一个全文检索中间件的解决方案。对中间件设计和实现中的关键技术进行了研究,包括多线程的网页爬虫、基于Bloom-Filter的大规模URL去重和网页正文内容提取。特别是从网页布局的角度来分析正文所处的位置,提出了简单可行的基于标签的网页正文抽取方法。实验表明该方法能够取得较高的正文提取正确率,是有效的,可引入实际应用中。此外,针对该全文检索中间件,通过实现的博客搜索系统Boso验证了其性能。
但由于信息抽取非常复杂,对于网页结构的复杂性,要做到100%准确是不可能的,但是如何能够最大限度地提高正文提取的准确率还需进一步研究。并且如何进一步使得中间件的对外接口更简单高效,更容易快速整合到Web站点中提供站内搜索服务,这也是后续需要继续完善的工作。
参考文献:
[1] Lucene. Lucene开源工具包[EB/OL]. [2011-01-25]. .
[2] JEsoft. JE中文分词组件JE-Analysis [EB/OL]. [2011-01-10]. .
[3] 邹永斌,陈兴蜀,王文贤.一个高性能Web资源收集系统的设计与实现[J].计算机科学,2008,35(4B):339-341.
[4] BLOOM B H. Space/time trade-offs in hash coding with allowable errors [J]. Communications of the ACM, 1970, 13(7): 422-426.
[5] 周登朋.搜索引擎的结果聚类研究[D].上海:上海交通大学,2007.
[6] 肖明忠,代亚非.BloomFilter及其应用综述[J].计算机科学,2004,31(4):180-183.
[7] MITZENMAEHER M. Compressed bloom filters [C]// Proceedings of the Twentieth Annual ACM Symposium on Principles of Distributed Computing. New York: ACM Press, 2001: 144-150.
[8] 宫学庆.基于BloomFilter的路径表达式查询处理[D].上海:复旦大学,2006.
[9] 吴丽辉,白硕,张刚,等.Web信息采集中的哈希函数比较[J].小型微型计算机系统,2006,27(4):673-676.
[10] 李晓明,凤旺森.两种对URL的散列效果很好的函数[J].软件学报,2004,15(2):179-184.
全文检索范文2
1 关于存储架构
1.1 存储架构结构
图1是非常经典的公司数据存储和密文全文检索模型,在这一模型内包含有两个参与者和专门使用服务器。
上述架构中的首要参与者为公司,公司需要将数据资源放置于云上,公司内有着相应的员工和专用服务器;其次就是云存储的服务商,主要任务为对公司的数据资源和索引文件等完成存储;专用服务器的主要作用为:颁发各种访问控制证书;为上传文明文本数据建立全文索引,并且对关键词进行加密;加密提交的数据文档资源;加密处理提交的关键词;增加、阐述和更新数据,对访问的控制权限以及云存储索引表进行体现。
1.2 数据加密、检索的程序
公司中的每一名员工都有专门的服务器所颁发证书,其中对员工的相关属性信息实行了反应。当员工需要对数据进行上传时,将数据和相关类别的证书实现数据解密策略,并将其提供至专门服务器上,随后实行相应的处理。为数据的机密性提供良好的保障,并且很好的对用户上传希望存储和加密的数据进行加密。并且公司员工可以检索公司大量数据,并且采用专用服务器首先针对数据实行文明建档再检索,随后加密索引表内的关键词,加密后的密文和文件需要被上传到云存储平台上,在该方式的作用下,云存储服务商便不能得知和查询中内的关键词和存储文件具体内容。
2 加密数据和检索密文
在图1中,主体公司要加密数据资源同时还要建立相应的索引实现建立,此外还要查找和解密。通过上述方法可以对两种比较关键的技术实现查找。
2.1 密文访问控制
在过去的不对称非加密算法内,只能够利用私钥加密公钥实现对密文数据的解密。这就不能实现密文数据的企业内共享。文章对Bethencourt等人所提出的密文规则实行了相应的参考,该方案的基本思想是:密文和私钥分别为属于属性集S和S’相关。属性集S和S’间的相交属性个数最小值是k的情况下,容纳与其中的属性集S’私钥能够解密加密包含中的属性集S密文。在CP-ABE访问控制策略下借助数据属制定程序,隐含在密文内,这样使用这一方法针对数据进行加密,对使用哪些策略进行确定,并且对相应的密文数据实行访问。基于该点可以符合文章内数据加密和密文全文检索上传储存。企业中的用户将一个详细的数据进行提交了之后,其他的企业相关用户可以通过一样的数据权限来访问该数据。
Bethencourt等人提出了CP-ABE,反应了能够实行非对称密钥数据加密,但是效率比较低,很难解决内容量较大的工作。对此文章采用的是混合机密机制,在实施了相应的改造后,服务器首先在随机下产生密钥K。随后针对K实时加密对称,并借助密钥K实现CP-ABC的非对称加密,将该算法的效率进行了提升。
2.2 密文检索
在加密关键词的全文检索基础上,第一步是要实现文明数据和加密属性集,并且要将这一数据提交至专门的服务器内,并且对文明数据实时逐一的分词,经过这一阶段之后,最终可以得到相应的关键词,通过加密方法写入至索引文件内,索引文件对相应的机密关键词进行了记录,此外还对关键词的所在位置和对应数据进行了记录。对此,要想实现在一致性的机密方式下实现对检索词的加密。匹配加密后的检索词和索引文件中的关键词,如果能够匹配则可以对相应加密密文找出来,同时进行下载,若是未实现成功,则实现了相应权限解密,这一属性对数据文档属性策略进行了满足,则能够找到到相应明文。
全文检索范文3
Apple系列的Spotlight
Spotlight搜索是iOS内置的一项搜索功能,他和内置应用无缝融合,比如它可以搜索通讯录、 邮件、提醒事项、语言备忘录、信息、音乐、视频等等。要对Spotlight进行设置,需要前往“设置/通用”。轻按“Spotlight”选项,按住右侧“ ”上下拖移,可以设定搜索结果类别的顺序,轻按名称可以“启动/取消”对该程序检索,从而设定“搜索”所搜索的内容区域(如图1)。
Spotlight使用Metadata搜索引擎,它被设计为可以找到任何位于电脑中的档案,包含文件、图片、音乐、应用程序,也可以是文件或是PDF中指定的字。Spotlight和传统搜索主要的差异,在于Spotlight是使用索引(Index Search)的方式,而传统搜索是传统的文件扫描方式;Spotlight就像是电脑里面所有的文档建立一个目录,里面存放索引文件,而要搜索的时候是去搜索这个目录中的索引文件,所以减少了文档扫描的时间,而传统扫描则是把整个文档内容扫描一遍,所以Spotlight在理论上来说,还是无法取代传统搜寻功能的。
若要使用Spotlight,在Mac OS X中,只需按一下屏幕右上角的Spotlight,在出现的栏位中输入你想要寻找的字串(如图2),或在 Finder、系统偏好设定或支持此功能的应用程序视窗内的搜寻栏位中,输入你的搜索字串。例如,若你想要找出Mac上所有jpeg图片,键入“*.jpg”;输入朋友的电子邮件地址及一些关键字,便可从朋友寄来的信件之中,找出主题符合你指定关键字的电子邮件。而在iPad和iPhone中,则更加简单,你只需在屏幕任意位置,向下滑动即可(如图3)。
从你开始输入的时候起,系统就开始显示它所找到的文档,并将搜索结果分门别类(包括文件、影像及 PDF 文件),你输入的字越多,搜索结果就越精确。
Windows下最强文件搜索神器 Everything
相比Windows下的其他搜索工具,Everything 无论是体积、索引数据库的大小,还是内存占用都是暂时我所见到最强的!Everything的体积才5百多KB,我硬盘上有300GB的数据,索引数据库仅有4.85MB(如图4),而内存占用仅为17MB左右,可以说是完胜其他的搜索工具了。
文件列表功能
在最近的版本中,Everything 增加了一个名为“文件列表”的新功能,你可以将一些完整的文件路径保存成一个文件列表供搜索之用。譬如你可以将U盘、移动硬盘连接上之后,将其内的所有文件保存成一个“文件列表”文件 (.efu格式),然后在 Everything 的“设置/索引/文件列表”里面添加这个文件列表让Everything加载它(如图5)。这样操作之后,即便平时没有连接该移动硬盘,一样可以搜索到它里面的文件!
Everything高效搜索技巧之“与”“或”
在Everything的搜索框中可以输入多个关键词,以空格分开,表示搜索结果要包括全部关键词。大家肯定对这种做法不会陌生,因为它正是搜索引擎的惯例。对应“与”的还有“或”(OR)运算,用半角竖线表示:|。当你不确信关键词的准确描述时,这种方式非常有用。
Everything的原理与局限
初接触Everything的你一定会好奇为什么它能快得这么离谱。其实Everything 并没有全部逐一扫描我们硬盘上的文件,而是通过读取NTFS文件系统中的USN日志来完成的。NTFS文件系统中的 USN 日志记录了系统对NTFS分区中的文件所做的所有更改。对于每一卷,NTFS 都使用 USN 日志来跟踪有关添加、删除和修改的文件的信息。感兴趣的朋友可以研究一下这个USN日志。由于Everything的工作原理是基于NTFS文件系统的,也就是它不能在 FAT32 的文件系统上使用了,这是 Everything 的一个局限之处。
安卓平台的免费文件快速搜索工具 Search Everything
虽然名字和功能相类似,但Search Everything应用和Windows上的Everything并无关系,它并不是 Everything 的 Android版(如图6)。
Search Everything 是 Android 平台上一款免费小巧的快速文件搜索应用,可以在毫秒级的瞬间搜索手机中所有文件或目录(文件夹)(如图7),找起文件来快到飞起,对于手机上存有大量文件文档的朋友来说,它绝对是提高你效率的一大利器。
全文检索范文4
【关键词】食品安全监督;问题;探讨与对策
【中图分类号】R155 【文献标识码】A 【文章编号】1004-7484(2014)-02-01004-02
食品安全问题已被人们所重视,从国家到地方都成立了安全委员会,食品安全监督工作也是解决民生工作的首要工作。现将笔者在日常的食品安全监督工作中常见问题进行探讨分析,同时提出解决对策。
1 食品安全监督中所见问题
1.1餐饮服务人员的自身卫生问题 尽管对餐饮服务人员进行定期培训, 但是餐饮服务人员的自身卫生问题仍存在引发食品安全问题的隐患。有些服务员的指甲很长,在端菜的时候手指接触到入口食品;还有的服务员没有把头发完全置于工作帽内,顾客在吃饭时,时常吃到头发,从而引发投拆案件。
1.2盛装食品的容器卫生不达标 进入饭店的后厨,映入眼帘的是色彩滨纷的塑料盆、塑料桶,里面盛装着直接入口的食品。在对他们的培训中三令五申的强调直接入口食品是不能用回收塑料容器盛装的,因为这些塑料制品卫生不达标,甚至致癌。但是这个问题在食品安全监督中屡见不鲜,成为食品安全的隐患。
1.3散装食品的保质期限问题 很多散装食品无包装、无厂家、无厂址,更无保质期限。这些散装食品因存放环境不符合要求,很快变质,商家为减少损失,将已过期的,变质的食品卖给顾客,顾客食用后引起食物中毒。
2 对食品安全中所见问题进行初步探讨
2.1对餐饮服务人员定期培训 加强对餐饮服务人员的培训工作,增强餐饮服务人员的卫生意识,避免由于自身卫生问题,引发投诉案件。餐饮服务业内部进行自检自查,建立健全卫生监督制度,指定专人负责该项工作,避免此类问题的发生。
2.2用卫生合格的容器盛装食品 提高对食品安全的认识,不用回收塑料制品直接入口的食品。有一些塑料制品不能看出是用回收塑料制成的,外观上制作工艺粗糙,颜色暗、不透明,这些塑料制品是有毒的,餐饮业应禁止使用。
2.3散装食品进货时应索证 在散装食品进货时应索要生产厂家的工商执照,卫生许可证,并要该产品的批批检验合格证,一旦发现质量问题及时与厂家联系;并且注意存放环境,确保在保质期内售完。
3 食品安全监督中所见问题的解决对策
3.1提高全民的食品安全意识 民以食为天,病从口入,严把食品安全关,防患于未然。从餐饮服务人员的自身卫生问题做起,定期对餐饮服务人员进行培训,对服务环节加强监督,确保消费者吃了放心。
3.2提高对有毒容器的认知能力 许多塑料容器是有毒的,餐饮业应禁止使用。特别是用回收塑料制成的容器,更是危害消费者身体健康的元素,最好使用不锈钢制品容器盛装直接入口食品,让消费者吃了安心。
3.3加强对散装食品的监督 建立健全进货索证制度,食品要放在通风干燥的地方,避免阳光直射,防尘、防蝇、防鼠、防潮,过期变质的散装食品一律下架消毁,让百姓吃了开心。
食品安全是民生问题中重中之重,食品安全监督工作关系到百姓的健康问题及生命安危,食品安全监督所见的问题不容忽视,亟待解决确保人民的安康。
参考文献:
[1] 郑杰,试论突发公共卫生事件应急体系建设 中国公共卫生管理杂志,2007.12(6)503-504。
[2] 周宪堂,高群,孙晓辉,大连市散装食品存在的问题与对策,中国公共杂志,2005.3.(6).342。
全文检索范文5
夯实社会管理基础,解决影响社会治安的根本问题
如前所述,社会治安问题根源在社会矛盾,源头在社会管理漏洞。因此,社会治安防控体系建设必须以夯实社会管理基础为前提。当前,各地流动人口成为违法犯罪的“主力军”,如广州市在2001年至2004年期间,流动人口刑事犯罪的比例达80%以上,浙江省近年来流动人口违法犯罪居高不下,流动人口作案已占全部刑事作案人员的60%以上,有的地方甚至高达90%以上[2]。因此,应当重点加强外来流动人口的管理。第一,加强基层组织建设,增强基层组织的社会管控能力。针对很多地区外来流动人口多、社区人口比例倒挂严重的特点,应当尽可能吸纳外来人口参与基层社会管理。比如,浙江省台州市路桥区吸收在当地居住3年以上、在本地居民和流动人口中都有良好口碑并经公安派出所政审通过的流动人口,和当地村“两委”成员、村民队组长组成“共建共享促进会”领导班子,共同管理当地有关事务,促进新老村民的融合[3]。应当说,这种实践模式是一种更有效率的流动人口管理组织方式,不仅能更加细腻地关照到流动人口社区自身文化特征和需求,而且对于维系社区内人员的联系和稳定性、增强外来人口对流入地的家园感、归属感都有很好的作用,从而有利于减少流动人口的违法犯罪。第二,支持、引导、规范社会组织发展,发挥社会组织的社会管理功能。社会组织作为特定含义的用语首次提出是在2007年党的十七大报告中,主要是指政党、政府之外的各类民间性的社会组织,主要包括社会团体、基金会、民办非企业单位、部分中介组织以及社区活动团体。长期以来,党和政府作为公共权力的载体,一直在公共事务管理中处于核心主导地位。但是随着经济结构的调整、利益格局的分化和市民社会的发展,社会组织开始加入到社会公共事务管理中来,很多社会事务已由社会组织运用其社会资源与社会权力来治理。从社会治安防控的角度来看,为解决外来流动人口这一影响社会治安的源头性问题,应当大力引导、规范外来人口同乡会、农民工协会、行业自治组织等社会组织的发展,以政府购买服务的形式对这些组织进行支持资助,要求它们对各自联系的外来人口群体进行约束、规制和教育,充分发挥社会组织在治安防控中的作用。第三,严格出租屋和流动人口管理,切实加强对实有人口和实有房屋的登记核查,落实出租房主的治安管理责任,进一步加大对违法出租屋业主的行政处罚力度,实现以罚促管的目的。推广普及“物业式”、“旅业式”、“院区围合式”、“单位自管式”、“散居包片式”、“公司运作式”、“统租统管式”等小区管理模式,通过加强日常管理预防流动人口违法犯罪。
推行治安防控参与奖励机制,破解群防群治工作难题
社会治安防控必须走专群结合的路子。大力加强群防群治工作,不仅能够缓解专门防控力量不足等方面的压力,而且能够真正落实“以防为主”的理念,在治安防控工作上取得更好的效益和效果。但很多地方的实际情况是:一方面传统的组织动员、精神激励在市场经济条件下已经难以保证群众参与的深入性、持久性和连续性;另一方面外来流动人口家园感、归属感不强,缺乏维护社会安全的主动性。如何拓展群众参与治安防控工作的途径,充分调动和发挥群众维护社会治安稳定的积极性,是迫切需要解决的问题。针对这一情况,我们建议推行治安防控参与奖励机制,破解群防群治工作难题。必须认识到,针对犯罪预防计划的设计要把群众定位为市场经济体制下的理性经济人,其行为的做出基于自身利益的考虑。群防群治工作既要考虑群众参与防范中的收益,即安全风险的控制、损失的减少等,也要考虑群众参与过程中要付出的代价,包括物质方面或精神方面,如进行某种防范设置所需要的费用、举报违法可能招致的报复等。因此,需要建立健全与社会主义市场经济相适应的参与犯罪预防保护激励机制[4]。具体来说,应当建立社会治安防控参与奖励专项基金,由财政拨付专款,纳入财政专户管理,并可以接受社会捐助。同时,明确群众参与治安防控奖励机制的基本内容:在参与事项上,可以包括及时向公安机关反映可疑情况和违法犯罪线索,参与治安巡逻和看楼护院活动,协助保护案事件现场,积极制止不法侵害,同违法犯罪行为作斗争等;在参与方式上,群众可通过直接参加、投寄书信、电话联系、发送邮件、网上发帖、投诉举报等方式参与治安防控工作;关于受奖励人员范围,除国家公职人员、政府聘用的专职治安辅助力量外,不论是否户籍人口,凡积极参与治安防控工作的群众,符合奖励条件的,均可获得奖励;关于奖励的内容,可以现金、实物为主,同时设置若干荣誉称号。如果受奖人员是外来人口,可以将参与治安防控的实效和荣誉称号的获得适当与申办城市户籍联系起来。在治安防控参与奖励机制的具体实施上,可以采用积分形式,针对不同的治安防控参与事项赋予不同分值,设计积分换算物质奖励或评选荣誉称号的标准。通过推行治安防控奖励机制,有利于充分调动人民群众参与社会治安防控的积极性和主动性,有助于破解很多地方警力相对不足、治安防范难度大的困境。
全文检索范文6
关键词:核安全;医院管理;文化建设
1核安全文化的定义
核科学技术的进步极大地推动了放射医学的发展,形成了4类放射诊疗活动:放射治疗、核医学、介入放射和X射线影像诊断,使医学诊断学、肿瘤学和循证医学等学科得到了长足的发展,为疾病诊治提供了有力手段[1]。但在获得医疗便利的同时,放射医学可能带来的辐射损害也不容忽视。电离辐射可对生物细胞造成损伤,还可能会诱发肿瘤、增加罹患遗传疾病的概率。据联合国原子辐射效应科学委员会的报告,医疗照射是公众所受电离辐射照射的最大人工来源[2]。加强医院辐射安全管理,保障从业人员及公众免受过量照射,已成为放射医学领域最为关注的问题。在大力倡导核安全文化的大环境下,世界各国均制定了大量的相关法规标准,但要切实到达高标准的辐射安全水平,仅有政策上的手段是不够的,还要依靠从业人员的职业态度和行为表现[3],这种态度和行为表现即指安全文化。“安全文化”一词的提出源于对美国三哩岛和前苏联切尔诺贝利两次严重核事故中人为错误的分析,首次出现在国际原子能机构的国际核安全咨询组1986年的《关于切尔诺贝利事故后评审会的总结报告》(INSAG-1)中[4]。1991年,国际原子能机构在《安全文化》中对安全文化作了系统的论述,提出安全文化的完整概念,强调只有全体员工致力于一个共同目标才能获得最高水平的安全[5]。《国际电离辐射防护和辐射源安全的基本安全标准》这样定义安全文化,“组织机构和人员的种种特性和态度的总和,它确立安全第一的观念,即防护与安全问题由于其重要性而保证得到应有的重视”[6]。这一原则适用于所有的放射源安全和防护实践中,是我国《电离辐射防护与辐射安全基本标准》(GB18871-2002)的蓝本,它强调人员的工作态度、思维习惯和组织的工作方法与优先性。在这一标准中强调“应当反复灌输用以支配所有与辐射源有关的个人和组织机构对防护与安全的态度和行为的安全文化”[7]。核安全文化由两大部分组成:第一,是单位内部的必要体制和管理部门的逐级责任制;第二,是各级人员响应上述体制并从中得益所持的态度。图1是核安全文化的具体组成部分及职责,核安全文化是所有从事与核安全相关工作的人员参与的结果,它包括相关的操作人员、管理人员及决策层。
2医院核安全文化建设的必要性
医疗行业是电离辐射技术应用广泛的领域,是辐射事故的多发行业,医疗照射是公众接受电离辐射剂量负担最大的人为来源.我国的医疗机构具有数量多、分布广、服务面大等特点,现在最大的职业性受照群体即为医疗行业从事放射工作的人员,大量接受放射诊疗服务的患者或受检者则成为最大的非职业性受照群体。根据2009年中国卫生年鉴的数据显示,在辐射卫生被监督的50196家单位中,医疗机构就有46712家,占93.6%。在这些单位中,疑似放射病的人数是490人,其中医务人员就有481人;职业禁忌的人数有1539人,医务人员占88.4%;个人剂量监测超标的人数有801人,医务人员占88.0%[9]。我国1988~1998年发生的辐射事故中80%以上可以避免,不适当的安全文化直接或间接地导致了事故的发生[10]。因此,医院辐射安全管理既要切实实现辐射防护,还须关注潜在照射的问题,加强核安全文化建设,从思想源头上杜绝医疗辐射事故的发生[11],保障医疗辐射工作人员及公众免受过量照射。综上所述,在医院辐射安全管理中,技术措施只能实现低层次的基本安全目标,管理和组织措施能实现较高层次的安全目标,但要从根本上保障安全,最终还要靠自身的核安全文化建设,核安全文化不会自然产生和存在,需要经历一个长期的培育过程,只有提高从业者和管理者对核安全文化建设的认识,不断更新观念,倡导“以人为本、安全第一”的理念,才能不断创造安全医疗服务的新局面。
3医院核安全文化建设现状
核安全文化概念已提出二十多年,在核工业、煤炭、建筑业、民航运输业、工程管理、电力等企业和机构得到初步的重视和发展,但在医疗卫生行业,尚未形成完善统一的核安全文化体系,从辐射安全管理、辐射防护等角度对核安全文化建设的研究也不多,存在的问题主要包括:
3.1核技术的医疗应用专业多,分支细,各专业核安全文化建设差异大。放射医学主要包括放射肿瘤学、临床核医学、介入放射学、X射线诊断学等四大学科,每项专业又有很多细的分支。不同的医学工作在辐射防护和安全要求上各有侧重,且有自己的运行体系。因此各专业核安全文化存在一定差异,在文化建设统一上必然有一定难度。3.2医院等级不同,工作任务量及种类存在差异,核安全文化建设参差不齐。根据我国的卫生法规,医院实行等级制度,不同级别的医院承担不同的辐射医疗服务工作。等级低的医院辐射工作单一,工作量相对较轻,等级越高的医院所从事的辐射医疗服务越全面,医务人员的工作量越繁重。因此不同的医院对辐射防护和核安全文化的要求不尽相同,造成医院间的核安全文化建设参差不齐。3.3医务人员的个人素质存在差异,辐射安全态度和意识水平不同。我国现阶段的医疗教育体制和医疗就业环境,造成医务人员的学历高低与医院级别的高低相对平行,导致不同医院间的从业人员素质存在一定差异。不同级别的医院对其医务人员的再教育程度也不尽相同,使得业内员工不能形成统一的核安全文化水平。即使在一个医院内部,医务人员也因职位不同、层级不同、工种不同形成不同的辐射安全态度和意识。在日常工作中,有部分工作人员不认真佩戴个人剂量计,认为“没有用”;不按规定穿戴防护用具,嫌“麻烦”、“不卫生”;进行介入诊疗、核医学等高剂量放射操作时认为“反正就一会儿,时间短,没多大剂量”,持有这些思想的工作人员不在少数。3.4上级主管部门对核安全文化建设重视不足。我国目前针对辐射安全管理的法规和标准已基本健全,也已多方提及核安全文化的理念,但在实际操作中,(总105)《中国医刊》2017年第52卷第1期监管部门多把目光放在场所评价、人员管理、设备检测等方面,对医疗机构核安全文化水平的建设和评价缺乏重视。部分医院的领导层和管理者对辐射安全不重视,相当一部分工作人员的辐射安全意识有待加强和提高。
4医院核安全文化建设的建议
在国家大力加强核安全文化宣传贯彻的大环境下,医院核安全文化建设存在的问题必须得到正视并积极解决,笔者提出如下几点解决措施及建议。
4.1建立科学的辐射安全管理机构及制度贯彻核安全文化的首要任务是建立辐射安全管理机构或明确专人负责相关放射医学设备的安全管理工作。核安全文化是无形的,但其建设水平会直观的体现在医院辐射安全业绩上,科学的辐射安全管理机构及制度是医院建设高水平核安全文化的重要保证及有形考核指标。规范合理的操作规范、辐射安全与防护管理制度、辐射事故应急预案等文件,可有效规范约束医务工作人员的行为,减少其工作中的主观随意性,使医院始终保持高水平的核安全文化水平。4.2重视自我辐射监测,开展辐射工作人员培训自我辐射监测是医院开展核安全文化建设的基础,良好的辐射监测能力是做好自身辐射安全与防护工作的前提。辐射监测可分为工作场所监测和个人监测。就放射医学而言,工作场所监测重点关注外照射水平、表面污染及空气污染;个人监测主要关注外照射、内照射和皮肤污染监测。在制订监测方案及计划并严格执行的基础上,还要积极培训相关人员,转变思想,使他们充分认识辐射监测的重要性。医院应配备专业监测设备,定期检定,保证测量数据的真实客观,并及时记录,做到有据可循。对于异常监测结果,要积极处理,深究原因,切实解决辐射防护方面存在的问题。4.3加强核安全文化宣传,培养辐射安全管理人才核安全文化属于管理的“软技术”,在某些情况下会对医院发展成败起到关键作用[13]。国际经验证明良好的安全文化对保证医用辐射健康发展、减少事故发生有至关重要的作用,医院文化一旦形成将具有导向功能、约束作用、激励作用、凝聚作用、辐射作用,达到转变工作人员辐射安全观念的目的,带动患者转变辐射安全观念[14]。加强核安全文化宣传可利用宣传展板、宣传画、演讲、培训、竞赛等多种形式进行。核安全文化建设对医务人员自身的核安全文化素养有很高要求。辐射安全管理不是一个人的职责,需要与梯队形管理团队进行。建设高文化素养的医院辐射管理人才团队,需要重视人才的筛选,建立规范合理的用人机制[15]。针对专业型管理人才和业务型管理人才采用不同的培养方式,使他们各司其职,发挥所长,为医院的核安全文化建设贡献力量。4.4转变观念,院领导带头参与核安全文化建设院领导应具有高瞻远瞩的战略眼光和以人为本的理念,在着眼于医院效益及业务拓展的同时,带头参与核安全文化建设,积极贯彻国家加强辐射安全监管及辐射防护工作的政策,狠抓措施的落实和执行情况,促进医务人员自觉遵守制度和规程,规范本院的辐射安全管理工作,发展安全文化建设。以科室为单位,建立以科主任为核心的质量管理体制,充分发挥科室自身的约束机制,提高科室乃至全院的整体素质,减少辐射安全事故的发生[16]。
5结语
核安全文化建设在医院辐射安全管理中有着不可替代的作用,必须得到医院及有关部门的高度重视。安全文化建设与辐射安全管理工作密不可分,在实际工作中,应建立科学的辐射管理机构及制度、做好自我辐射监测工作、加强辐射工作人员的培训教育、提高医务人员核安全文化素养,实现辐射防护目标,保证放射医学持续健康快速发展,减少辐射事故的发生。
参考文献:
[1]郭欣,邓明卓,刘江.对综合性医院辐射安全管理的探讨[J].中国医院管理,2011,3(31):59-60.
[2]UNSCEAR.Ionizingradiation:sourcesandbiologicaleffects[M].NewYork:UN,1982.
[3]刘长安,王文学,贾廷珍.贯彻《职业病防治法》,发展辐射安全文化[J].中国工业医学杂志,2003,16(1):54-56.
[4]INSAC.Thesummaryreportonthepost-accidentreviewmeetingonthechernobylaccident[J].IAEA,1986,5(5):403-404.
[5]INSAG.Safetyculture(IAEASafetySeriesNo.75-INSAG-4)[J].IAEA,1991,7(1):121-129.
[6]GB18871-2002.电离辐射防护与辐射源安全基本标准[S].
[7]19-295-1997.国际电离辐射防护和辐射源安全的基本安全标准,安全丛书No.ll5[S].
[8]范深根.我国放射事故概况与原因分析[J].辐射防护,2002,22(5):277-281.
[9]卫生部.2009年中国卫生年鉴[EB/OL]./publicfiles/business/htmlfiles/zwgkzt/ptjnj/200908/42635.htm.
[10]胡莲芝.江苏地区1960-1993年放射事故调查与分析[J].中国辐射卫生,1995,4(4):240.
[11]刘长安,贾廷珍,王文学.培育健康的辐射安全文化[J].中华放射医学与防护杂志,2002,22(6):457.
[12]张璐.浅谈提高企业职工安全文化素质以企业安全文化提升企业安全管理[J].大众商务,2009(9):91.
[13]张久明.加强医院文化建设提高医院管理绩效[J].中国医院管理,2008,28(12):75.
[14]张亚兵,丁牧原.医院文化建设在医院管理中的作用[J].中国医院管理,2008,28(9):59.
[15]戴礼成,刘华琼.论医院管理改革与体现以人为本[J].中国医院管理,2008(6):12.