人工智能在医疗诊断的应用范例6篇

前言:中文期刊网精心挑选了人工智能在医疗诊断的应用范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

人工智能在医疗诊断的应用

人工智能在医疗诊断的应用范文1

人工智能不是一项单一的科技产业,而是将其他行业进行融合的工具,例如将机器人和保姆结合产生的“看家机器人”,将导航和汽车结合产生的“车联网”等。在人工智能技术逐步成熟的当下,谁率先在应用上实现突破,谁就有可能在智能时代的竞争中占据优势。

目前,从医疗健康的监测诊断、智能医疗设备,到教育领域的智能评测、个性化辅导、儿童陪伴,从电商零售领域的仓储物流、智能导购和客服,到应用在智能汽车的自驾技术,都能看到人工智能的身影。

中国在过去的一年里,长虹、TCL、创维等家电企业都纷纷人工智能家电产品,希望借助人工智能打破家电行业的销售难题。

不久前,搜狗公司2016全年财报,搜狗借助人工智能技术实现了较大的业绩增长。

近年来,百度先后成立了大数据实验室、深度学习实验室和硅谷人工智能实验室,并通过架构调整全面发力人工智能。2016年百度世界大会上,推出“百度大脑”,该项目将对语音、图像、自然语言处理和用户画像、无人驾驶等领域进行重点关注和研发。

人工智能技术的重大突破必将带来新一轮科技革命和产业革命'对社会经济和人类生活的方方面面将产生深远的影响。

人工智能将为现代化发展更换“发动机”。咨询公司埃森哲研究了美国、芬兰、英国等12个发达国家并作出预测,到2035年,人工智能将帮助这些国家生产率提高40%左右。

对于中国而言,人工智能带来的好处将是多方面的。就经济来说,借助人工智能新技术实现自动化,将极大提高生产率,节省劳动成本;优化行业的现有产品和服务,提升其质量和劳动生产率;通过创造新市场、新就业,将促进市场更加繁荣,开拓更广阔的市场空间。

在产业升级方面,中国的传统制造业大而不强的问题亟待克服,人工智能恰恰为制造业转型升级提供了便利和动力,一是这些企业拥有行业海量的数据和大量资金;二是在生产力水平急需提升、传统人口红利逐渐消失的情况下,传统企业有迫切的意愿来改造升级自己的工厂、业务,提高收益,降低企业成本。因此,制造业既是人工智能可以大有作为的领域,也是中国发展人工智能的优势领域。

《全球人工智能发展报告2016》显示,中国人工智能专利申请数累达到15745项,列世界第二;人工智能领域投资达146笔,列世界第三。

人工智能在医疗诊断的应用范文2

了解,到2020年,我国的人工智能市场规模将接近百亿。而人工智能在医疗领域的应用关键体现在与医疗相结合的“算法+有效数据”,其中,有效健康数据是人工智能应用的基础。

一项调查表明,美国的医学影像数据年增长率为63%,放射科医生数量年增长率却仅为2%。同样的情况也发生在中国,面对中国庞大的人口基数,医生的数量将远远跟不上医学影像数据的增长,而人工智能的到来可以有效弥补缺口。

最近,创业邦(微信搜索关注:ichuangyebang)了解到一家创业公司――汇医慧影,这家公司在2015年创立,从医疗影像角度切入并结合了人工智能,选择用长链条的方式布局影像行业。

“我们希望通过新技术、新服务跟各个机构共同建造一个新的生态。”汇医慧影CEO柴象飞说道。

汇医慧影目前已获数千万元A轮融资,合作医院超过400家,已获得11个软件著作权,4个发明专利,今年已申请2个国家自然科学基金以及2个省级自然科学基金和2个科技部的重点专项。

云平台实现“三端互联”

汇医慧影利用人工智能打造智慧影像平台,用以提高医生诊疗效率与准确度,解决部分地区医患资源不匹配的问题。目前其产品已经覆盖影像云平台、放疗云平台、电子胶片、常规阅片外包服务、疑难大病专家会诊及医生集团等六大模块。其中,常规阅片外包服务可帮助影像中心实现影像线上诊断,从而实现分级诊疗。

从IT的云系统出发,平台已实现医生端、患者端、医疗机构端的“三端互联”。所有的功能都可在手机、电脑、平板电脑端实现。

医生端,平台会为其提供病例管理、医生在线讨论、专家学习等服务。柴象飞说,平台已经实现电子化胶片,可以直接把数字化的信息还原给患者。

患者端,可让患者向专家进行咨询并获得实时解答,平台还会为患者提供影像共享和健康管理服务。

医疗机构端,可以通过平台对接专家资源、存储并备份影像、跟踪用户并享受增值服务。

相比于影领、iDoctor、锐达影像等平台,汇医慧影的优势在于利用了分布式云平台。其利用压缩、TCP优化等技术,让平台的云技术实现了同传同看的效果。读写分离、分布式部署等实现了全国各地上传、阅片。

据柴象w介绍,平台对胸部X光片表现出的气胸、肺结核、肿块的自动诊断准确率已经达到95%,对脑核磁影像表现出的肿瘤的自动识别率超过85%,对胸部CT影像表现出的肺结节的识别率超过85%。

扩充数据维度,让AI在医学影像领域得到更好的应用

柴象飞曾在美国斯坦福大学癌症中心、荷兰癌症研究所和比利时鲁汶大学放射科三家世界顶尖的医学影像机构学习和就职,具有丰富的临床知识,掌握了医学影像的分割、存储、压缩和管理的核心技术。

他认为,医学影像是人工智能与医疗领域结合中最可行且是可能最先走出来的领域。

具体到实践中,医学影像基本需要做三件事:一是需要优化深度学习的方法,二是积累大量的优质数据,三是高性能的计算环境。“如果三者配齐,就会让训练模型达到一个相对自我学习和不断提高的状态。”柴象飞告诉创业邦(微信搜索:ichuangyebang)。

所以在技术层面上,汇医慧影将影像云、阅片服务以及智能诊断相结合,通过阅片获取结构化的数据,提供给深度学习引擎进行计算,并且将计算机学习后的结果使用在医生的阅片流程中。当计算机出现误判时,医生会纠正诊断结果并将结果反馈入系统,让系统进行二次学习。“通过这样一个在线学习的闭环,我们将持续更新有效数据,持续提高算法的精度。”柴象飞说。

除了数据量上的增加,数据维度的扩充也是汇医慧影正在做的事。

人工智能在医疗诊断的应用范文3

据一些经济学家研究,20世纪下半叶以来的“信息技术革命”与蒸汽革命、电气革命不可同日而语,并未真正大幅地提高人类的劳动生产率,互联网技术更多是丰富了人类的生活方式,但人工智能革命将是真正改变生产力的革命。

这两年人工智能在智能制造、智慧医疗上的应用可谓前途无量,政府部门、行业精英、科技巨头都将其作为未来发展的重点。从2016年开始,人工智能已经成为各大财经峰会、科技论坛的主题,也频频占据各大媒体版面的头条位置。从谷歌Master以60场完胜中日韩三国顶尖围棋选手,再到李开复提出“人工智能将取代50%工作”引发广泛议论,以及英国的新工业政策、微软的人工智能新布局、人民日报机器人“小融”的推出,一时间人工智能的出现犹如雨后春笋一般。火得一塌糊涂的人工智能正在逐步走进我们的生活,将彻底改变人类的生活和工作方式。

人工智能概念。1956年在Dartmouth学会上首次提出了人工智能(Artificial Intelligence,AI)一词。它是集研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统为一体的一门新的技术科学,是计算机科学的一个分支。它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。应避免一个误区,就是认为人工智能就是机器人,实际情况是机器人只是人工智能的容器。机器人有时候是人形,有时候不是,但是人工智能自身只是机器人体内的电脑。

人工智能领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能是大脑的话,机器人就是身体,但这个身体不一定是必需的。人工智能的概念很宽,所以人工智能也分很多种,一般分成三大类:弱人工智能、强人工智能、超人工智能。

弱人工智能(ANI): 弱人工智能擅长于单个方面的人工智能。它依赖于计算机强大的运算能力和重复性的逻辑,看似聪明,其实只能做一些精密的体力活。比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,如果问它如何能更好地在硬盘上储存数据,它就回答不了。另外在汽车生产线上也有很多是弱人工智能。可以看到的是,在弱人工智能发展的时代,对于一些重复性机械性的工作岗位来说,人类确实可能会迎来失业潮。

强人工智能(AGI):人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。创造强人工智能比创造弱人工智能难得多,百度的百度大脑和微软的小冰,都算是通往强人工智能的探索,通过庞大的数据,帮助强人工智能逐渐学习。

超人工智能(ASI): 牛津哲学家、知名人工智能思想家Nick Bostrom把超人工智能定义为“在几乎所有领域都比最聪明的人类大脑聪明很多,包括科学创新、通识和社交技能。”超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的。当人工智能学会学习,并及时自我纠错之后,在加速学习过程中是否能产生意识,尚不能确定,但可以肯定其能力会得到极大的提高。比如,阿尔法狗会根据棋手的棋路调整策略就是最浅层的创新体现,普通手机版的围棋棋路其实就是固定的几种模式。

人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大。现阶段人类对弱人工智能的掌握比较多,弱人工智能无处不在。但更高一阶的研究更加吸引人类的探索。人工智能革命是从弱人工智能开始,通过强人工智能的过渡,最终到达超人工智能的过程。这段旅途到底会给人类带来更好的未来还是灾难,无法简单判断。但是无论如何,世界将会因此变得完全不一样。

人工智能涉及领域。人工智能在某些领域的研究距离我们的生活似乎依然非常遥远,但经历了数十年的研发和探索,这项技术已经催生出了不少有趣的应用方向,它们已经开始在我们的生活中带来实实在在的便利。当前人工智能的应用领域:(1)计算机视觉。主要利用计算机来判断图像数据当中是否包含特定的物体、特征或行为。举个例子,当侦察机拍摄到一张图像之后,专家们会对其进行分析以找出当中是否存在敌区;警察可以使用计算机来寻找符合罪犯画像的照片;医生也可以利用该系统去诊断病人。还有现在广泛应用的面部识别系统也同样利用到了计算机视觉技术。(2)语言识别。语言识别系统需要经过一段时间的训练和熟悉才能达到足够高的准确率。早在20世纪90年代,计算机语言识别就已经在一些特定的应用方向中达到了使用水平。而现在,这项技术已经被广泛应用在了手机和汽车等日常工具当中。对于日益流行的虚拟助手而言,语言识别也是不可或缺的基础。(3)私人助手。苹果、谷歌和微软已经为各自的移动平台开发了虚拟私人助手,旨在帮助用户处理一些基本的日常事务,比如发短信、查地图和制定日程表,等等。它们和钢铁侠的JARVIS相比可能显得非常呆板和原始,但的确给我们的日常生活带来了便利。(4)智能机器人。智能机器人可以被应用在工厂的自动化投递、管道检查、拆弹和危险/位置区域探索当中。它们可长时间工作而无需休假,维护费用低于工人工资,同时精准度更高。Pepper是风靡日本的一款智能人形机器人。它或许无法被应用于工业生产,但却非常健谈。它的主要应用领域是企业、零售和客户服务,不过你也可以把它放在家里作为家庭伴侣,烦闷时和它聊聊天。Pepper之所以可以被称作是一部智能机器人,主要是因为它拥有来自IBM Watson人工智能计算机的技术支持。在后者的帮助下,Pepper具备了图像、文字和视频分析能力,这也使其能够去理解更多类型的问题。

人工智能在医疗诊断的应用范文4

关键词:智能Agent;人工智能;中医诊疗;医案

中图分类号:R2-03 文献标识码:A 文章编号:1673-7717(2009)05-0965-03

人工智能(arificiM intelligence,AI)是当前科学技术发展中的一门前沿科学。1956年,人工智能作为新兴学科被正式提出。利用人工智能技术取得的成就已经引起人们能高度关注,有人把它与空间技术、原子能技术一起誉为20世纪的三大科学技术成就。

有学者认为人工智能是继3次工业革命之后的又一次革命,并且指出:前3次革命延长了人手的功能,把人从繁重的体力劳动中解脱出来,而人工智能则是延伸了人脑能功能。实现脑力劳动的自动化。人工智能技术在研究中取得了许多重要的成果,在机器人、自然语言理解、专家系统、图像识别、地质勘探、石油化工、军事、医疗诊断等领域应用十分广泛。

作为人工智能的关键技术成分,智能Agent技术经过十几年的理论建模,目前已开始初级应用。许多IT企业,如:微软、IBM、Oracle等都对Agent的开发投入了极大的热情,这在一定程度反映了Agent技术的广阔前景。本文搞针对智能Agent技术的起源、发展和未来前景进行初步阐述和探讨。

1 Agent概述

1.1 Agent的定义 目前学术界尚无一个公认的对Agent的定义,在国内多将其译为智能。M.Wooldridge和N.T.Jennlngs于1995年提出的:“Agent是满足特定设计需求的计算机(硬件或软件)系统,它位于特定的环境当中。具有高度的灵活性和自治性。”。这是Agent目前普遍被人们认可的定义。

1.2 Agent的特性 学术界通常认为Agent具有以下一些的特性。

自主性:Agent具有属于自身的计算资源和局部对自身行为控制的机制,能在无外界直接操纵的情况下,根据其内部状态和感知到的环境信息,决定控制自身的行为。

智能性:Agent能够从用户浏览的网页中提取出网页特征或链接信息,与知识库中的信息进行比较,将最接近的知识应用到该网页上,自动将网页中的信息抽取出来并反馈给用户,能够根据用户查询信息的行为进行判断和分析,以提高查询准确度。

适应性:智能Agent能够从用户日常的查询、浏览等行为中学习用户的兴趣点,推理用户的需求,为每个用户建立,个性化的用户框架,根据用户反馈对获取的知识和用户框架进行修正,以适应用户兴趣点的变化。

协作性:Agent可以通过某种Agent协作语言与其它Agent进行多种形式的交互,有效地与其它Agent协作工作,可以共享交流信息,实现协作式的信息查询,提高了信息查询的效率。

移动性:Agent能够在互联网上跨平台漫游,以帮助用户搜集信息,它的状态和行为都具有连续性。

安全性:Agent能够主动避免恶意的Agent对计算机环境造成破坏。

由于Agent技术具有以上诸多特性,这就决定了其在其它领域中的应用具有广阔的探索空间。医者作为诊疗过程中的主体,其认知具有经验性、灵活性、自主性、协作性等诸多特点,由此可见,Agent技术在这一方面也具有相似甚至相同的特征。在针对医者认知过程的研究中,智能Agent技术是否可以充当记录、模拟甚至传播的载体,都是值得研究者们共同探讨的课题。

2 智能Agent在医疗活动中应用可能具有广阔的前景

2.1 智能Agent信息检索系统将是医生获取知识的得力助手笔者认为,随着智能技术的发展,未来应用于医疗活动中的智能Agent,将能够根据医生的个人需要提供动态、实用、指导性强的医学信息。近年来,互联网得到了迅速的发展和广泛的应用,网络已经成为现代人获取信息和知识的重要途径。网上信息资源日益膨胀,搜索引擎只是初步解决了如何索引和查询Intemet浩瀚无垠、零乱分散的信息资源的技术难题。相对于用户希望的“花最少的时间能得到最相关的查询结果”的愿望来看,还存在很大的差距。因此对专业领域定的用户群提供专业的、量身定造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。在医学领域,我们面临着同样的尴尬:医学领域是一个时效性、交流性极强的学科范畴,往往在短时间内,临床工作者、科研人员就需要及时、准确的对应信息。网络资源虽具有纸介质媒体无法匹敌的信息资源,但分散、冗长的信息交错混杂,为科研工作增添了无谓的负担。缺乏专业、针对性强、灵敏的搜索引擎是科研人员亟需解决的问题。

目前,信息技术和网络技术已经在科研和医疗方面得以不同程度的应用。在科研方面,世界各国建立起了大量的医学、药物数据库为研究者提供信息服务,如包含9000余种美国处方和非处方药物信息的“药物信息库”,癌症数据库Cancerlit,有关艾滋病临床、药物研制及文献的AIDSDatabases,向医患人员提供的临床实验信息数据库Clinical-Trials.gov,包括健康指南、评价和消费者指南信息的全文数据库HSTAT,补充和替代医学资源NCCAM Resource,医学文献检索系统Medline等医学信息数据网络资源,诸如此类的网络资源极大的方便了医学科研工作者。在医疗方面,许多世界发达国家都在斥巨资、投入大量人力物力建设国家卫生信息系统,英国的卫生服务信息系统、美国的卫生服务信息框架HII(Health Information Infrastructure)、加拿大的电子健康系统(e-Health)和澳大利亚的电子健康网络(Health Online),各种已经应用的医院管理信息系统HIS、RIS、和PACS等,信息技术已经在医疗管理方面发生了深刻的变化。

我国卫生信息化建设起步较晚,医院层次的电子病历研究探索刚刚起步,与真正的信息化、网络化还存在较大的差距,中医药方面的网络资源包括中医药文献数据库检索系统、中国中草药大典、中药基本信息数据库、医学数据库大全、名老中医、中华药膳等,但由于中医药理论的自然哲学特点,信息化仅仅实现了文字的超文本化和图片的数字化。

有学者指出,基于智能Agent的个性化信息检索系统是一个具有个性化智能化的多Agent信息检索系统,它以用户为中心,挖掘用户的真实意图进行WWW搜索。

2.2 多Agent是学术交流的平台 由于Agent具有协作性

的特点,可以与多个Agent进行协调合作,共同完成复杂问题的求解,而传统的医学学术交流和解决疑难问题时,多采用专家会诊讨论的方式进行。因此,二者在问题解决模式上具有相通之处,甚至,Agent技术可以实现控制和协调远程医疗系统中的信息共享和交流,在医疗活动及医疗信息资源的广度和深度上实现系统的整合。

与传统模式相比,Agent技术为领域专家,提供了更广阔、更专业的智能信息平台,真正实现了跨地区、跨医疗单位的综合问题求解及疑难医学问题探讨,对于医疗资源的进一步共享,公平分布,甚至学术交流提供了更为广阔的空间。

3 中医诊疗智能化的探索

在过去几十年中,利用人工智能技术探讨中医诊疗过程已经取得了一部分成果。自1979年关幼波肝炎诊治系统的出现,为中医诊疗与人工智能技术的结合揭开了崭新的一页。随后,陆续出现了一些旨在快速有效解决问题的医疗专家系统,但这些专家系统更注重专家诊疗经验与智能技术的结合,对于医者的认知在诊疗中的决策作用尚未进行深入探讨和挖掘。随着人工智能技术的发展,有学者尝试运用人工神经元网络的方法,在中医领域建造了第二代专家系统的外壳。发挥神经元网络的特点弥补了知识获取和深层知识推理的不足。这些研究成果虽然并未在医疗活动中得到广泛的推广和使用,但在中医诊疗智能化研究进程中有着不可磨灭的贡献。

在未来的智能Agent中医诊疗平台中,作为一种理想,是要做到人与计算机之间形成同伴关系,即关键之处、需要经验知识之处必须靠人,至于可以形式化的处理的地方则靠计算机,两者密切结合,使得在求解问题的过程中,甚至难以判断所使用的知识究竟是来自计算机的还是来自人的。这个理想将彻底改变人随机器运行方式进行思考的被动局面。笔者认为,如何建立更适合医生诊疗操作、群体交流和能激发医者灵感涌现的智能Agent平台,一方面有赖于智能技术的不断发展,另一方面,医案不妨作为理论研究模型构筑的切入点。

清代医家周学海认为:“宋以后医书,唯医案最好看,不似注释古书之多穿凿也。每部医案中,必有一生最得力处,潜心研究,最能汲取众家之所长。”现代名医恽铁樵所云:“我国汗牛充栋之医书,其真实价值不在议论而在方药,议论多空谈,药效乃事实,故造刻医案乃现在切要之图。”通过对医案的学习和研究,了解中医各名家的学术思想和临床辨证论治的特色,并对其进行归纳和总结上升为共性的诊疗规律,以便于更好的为临床服务。

然而,医案方面的书籍众多,这为临床工作者在面临疑难问题求解是造成了很大的困难,传统方式的研读多是从名家医案入手,从中获得宝贵的诊疗经验,在临床上实践,根据病人病情的变化用心思索,调整治疗方案。经过不断的学习、实践和思索,实现经验积累,同时也在诊疗过程也是形成新的医案资料的过程。用计算机和专家系统整理古籍医案工作已经开展了多年,在取得成果的同时,也存在错检、漏检、统计结果呆板,功能不全等问题。如何能从医案人手,发挥计算机技术在医案整理中数据完整,记忆准确的长处;发挥智能Agent技术在构建人机界面时对诊疗思维的启发性和使用的便捷性;发挥医者在诊疗过程的主动性。有待于进一步探索。

人工智能在医疗诊断的应用范文5

据统计,2017年中国人工智能核心产业规模超过700亿元,随着各地人工智能建设的逐步启动,预计到2020年,中国人工智能核心产业规模将超过1600亿元,年复合增长率将达31.7%。

随着人工智能技术的不断成熟,人工智能创业的难度逐步降低,越来越多的创业公司加入人工智能的阵营。

2018年被称为人工智能爆发的元年,人工智能技术应用所催生的商业价值逐步凸显。人工智能逐步切入到社会生活的方方面面,带来生产效率及生活品质的大幅提升。智能红利时代开启!资本、巨头和创业公司纷纷涌入,将人工智能拉到了信息产业革命的风口。

如何把握产业动向,抓住风口机会?创业邦研究中心凭借在人工智能等前言科技领域持续研究、洞察的能力,在对国内人工智能创业公司进行系统调研的基础上,推出《2018中国人工智能白皮书》,对人工智能的核心技术、主要应用领域、巨头和创业公司的布局、未来发展态势和投资机会进行了深度解析。

第一部分人工智能行业发展概述

1.人工智能概念及发展

人工智能(Artificial Intelligence, AI)又称机器智能,是指由人制造出来的机器所表现出来的智能,即通过普通计算机程序的手段实现的类人智能技术。

自1956年达特茅斯会议提出“人工智能”的概念以来,“人工智能”经历了寒冬与交替的起起伏伏60多年的发展历程。2010年以后,深度学习的发展推动语音识别、图像识别和自然语言处理等技术取得了惊人突破,前所未有的人工智能商业化和全球化浪潮席卷而来。

人工智能发展历程

2.人工智能产业链图谱

人工智能产业链可以分为基础设施层、应用技术层和行业应用层。

A基础层,主要有基础数据提供商、半导体芯片供应商、传感器供应商和云服务商。

B技术层,主要有语音识别、自然语言处理、计算机视觉、深度学习技术提供商。

C应用层,主要是把人工智能相关技术集成到自己的产品和服务中,然后切入特定场景。目前来看,自动驾驶、医疗、安防、金融、营销等领域是业内人士普遍比较看好方向。

人工智能产业链

资料来源:创业邦研究中心

第二部分人工智能行业巨头布局

巨头积极寻找人工智能落地场景,B、C 端全面发力。

资料来源:券商报告、互联网公开信息,创业邦研究中心整理

第三部分机器视觉技术解读及行业分析

1.机器视觉技术概念

机器视觉是指通过用计算机或图像处理器及相关设备来模拟人类视觉,以让机器获得相关的视觉信息并加以理解,它是将图像转换成数字信号进行分析处理的技术。

机器视觉的两个组成部分

资料来源:互联网公开信息,创业邦研究中心整理

2.发展关键要素:数据、算力和算法

数据、算力和算法是影响机器视觉行业发展的三要素。 人工智能正在像婴儿一样成长,机器不再只是通过特定的编程完成任务,而是通过不断学习来掌握本领,这主要依赖高效的模型算法进行大量数据训练,其背后需要具备高性能计算能力的软硬件作为支撑。

深度学习出现后,机器视觉的主要识别方式发生重大转变,自学习状态成为视觉识别主流,即机器从海量数据里自行归纳特征,然后按照该特征规律使图像识别的精准度也得到极大的提升,从70%+提升到95%。

3.商业模式分析

机器视觉包括软件平台开发和软硬件一体解决方案服务。整体用户更偏向于B端。软件服务提供商作为技术算法的驱动者,其商业模式应以“技术层+场景应用”作为突破口。软硬件一体化服务供应商作为生态构建者,适合以“全产业链生态+场景应用”作为突破口,加速商业化。

(1)软件服务:技术算法驱动者—“技术层+场景应用”作为突破口

这种商业模式主要是提供以工程师为主的企业级软件服务。有海量数据支撑,构建起功能和信息架构较为复杂的生态系统,推动最末端的消费者体验。

此类商业模式成功关键因素:深耕算法和通用技术,建立技术优势,同时以场景应用为入口,积累用户软件。视觉软件服务按处理方式和存储位置的不同可分为在线API、离线SDK、私有云等。

国内外基础算法应用对比

资料来源:互联网公开信息,创业邦研究中心整理

(2)软硬件一体化:生态构建者—“全产业链生态+场景应用”作为突破口

软硬一体化的商业模式是一种“终端+软件+服务”全产业链体系。成功的因素是大量算力投入,海量优质数据积累,建立算法平台、通用技术平台和应用平台,以场景为入口,积累用户。亮点是打造终端、操作系统、应用和服务一体化的生态系统,各部分相辅相承,锐化企业竞争力,在产业链中拥有更多话语权。

4.投资方向

(1)前端智能化,低成本的视觉解决模块或设备

从需求层面讲,一些场景对实时响应是有很高要求的。提供某些前端就本身有一定计算能力的低成本的视觉模块和设备将有很大市场需求。前置计算让前端设备成为数据采集设备和数据处理单元的合体,一方面提升了处理速度,另一方面可以处理云端难以解决的问题。

机器视觉在消费领域落地的一个障碍是支持高性能运算的低功耗、低价位芯片选择太少。从低功耗、高运算能力的芯片出发,结合先进的算法开发模块和产品,这类企业将在机器视觉领域拥有核心竞争力。

(2)深度学习解决视觉算法场景的专用芯片

以AI芯片方式作为视觉处理芯片有相当大的市场空间。以手势识别为例,传统的识别方案大都基于颜色空间,如 RGB,HSV ,YCrBr,无法排除类肤色物体及黑色皮肤对识别精度的干扰。借助深度学习,如通过 R-CNN 训练大量标注后的手势图像数据,得到的模型在处理带有复杂背景及暗光环境下的手势识别问题时,比传统方案的效果好很多。

(3)新兴服务领域的特殊应用

前沿技术带来的新领域(如无人车、服务机器人、谷歌眼镜等),对机器视觉提出了新要求。机器视觉可以让机器人在多种场合实现应用。服务机器人与工业机器人最大的区别就是多维空间的应用。目前国内的机器视觉,涉及三维空间、多维空间,其技术基本上处在初始阶段,未来存在较大市场增长空间。

(4)数据是争夺要点,应用场景是着力关键

机器视觉的研究虽然始于学术界,但作为商业应用,能解决实际问题才是核心的竞争力。当一家公司先天能够获得大量连续不断的优质场景数据,又有挖掘该数据价值的先进技术时,商业模式和数据模式上就能形成协同效应。创业公司要么通过自有平台获取数据,要么选择与拥有数据源的公司进行合作,同时选择一个商业落地的方向,实现快速的数据循环。

第四部分智能语言技术解读及行业分析

1.语音识别技术

(1)语音识别技术已趋成熟,全球应用持续升温

语音识别技术已趋成熟,全球应用持续升温。语音识别技术经历了长达60年的发展,近年来机器学习和深度神经网络的引入,使得语音识别的准确率提升到足以在实际场景中应用。深度神经网络逐步找到模型结构和调参算法来替代或结合高斯混合算法和HMM算法,在识别率上取得突破。根据Google Trends统计,自2008年iPhone及谷歌语音搜索推出以来语音搜索增长超35倍。百度人工智能专家吴恩达预测,2020年语音及图像搜索占比有望达到50%。Echo热销超过400万,带动智能音箱热潮。

(2)语音识别进入巨头崛起时代,开放平台扩大生态圈成主流

语音识别即将进入大规模产业化时代。随着亚马逊Echo的大卖,语音交互技术催生的新商机,吸引大大小小的公司构建自己主导的语音生态产业链。各大公司纷纷开放各自的智能语音平台和语音能力,欲吸引更多玩家进入他们的生态系统。

(3)语音识别技术发展瓶颈与趋势

低噪声语料下的高识别率在现实环境使用中会明显下降到70-80%,远场识别、复杂噪声环境和特异性口音的识别是下一个阶段需要解决的问题。

麦克风阵列类前端技术不仅是通过降噪和声源定位带来识别率的提高,带环境音的语料的搜集、标注可用于模型的训练,有助于打造更新一代的语音识别引擎技术。语音巨头已经在布局。

在IOT包括车载领域,云端识别并非通行的最优方案,把识别引擎结合场景进行裁剪后往芯片端迁徙是工程化发展的方向。

2.自然语言处理(NLP)发展现状

(1)多技术融合应用促进NLP技术及应用的发展

深度学习、算力和大数据的爆发极大促进了自然语言处理技术的发展。深度学习在某些语言问题上正在取得很大的突破,比如翻译和写作。2014年开始LSTM、Word2Vec以及Attention Model等技术研究的进展,使DL有了路径在语义理解领域取得突破,并且已经有了明显的进展。对话、翻译、写作新技术成果里都开始逐渐混合入DL的框架。2014-2015年,硅谷在语义理解领域的投资热度剧增。

深度学习能最大程度发挥对大数据和算力资源的利用,语义理解的发展还需要深度学习、搜索算法、知识图谱、记忆网络等知识的协同应用,应用场景越明确(如客服/助理),逻辑推理要求越浅(如翻译),知识图谱领域越成熟(如数据饱和度和标准性较强的行业),技术上实现可能性相对较低。在各种技术融合应用发展的情况下,具备获取一定优质数据资源能力并可结合行业Domain knowledge构建出技术、产品、用户反馈闭环的企业会有更好的发展机会。

(2)NLP主要应用场景

问答系统。问答系统能用准确、简洁的自然语言回答用户用自然语言提出的问题。基本工作原理是在线做匹配和排序。比如 IBM 的 Watson,典型的办法是把问答用FAQ索引起来,与搜索引擎相似。对每一个新问题进行检索,再将回答按匹配度进行排序,把最有可能的答案排在前面,往往就取第一个作为答案返回给用户。

图像检索。同样也是基于深度学习技术,跨模态地把文本和图片联系起来。

机器翻译。机器翻译的历史被认为与自然语言处理的历史是一样的。最近,深度学习被成功地运用到机器翻译里,使得机器翻译的准确率大幅度提升。

对话系统。对话系统的回复是完全开放的,要求机器能准确地理解问题,并且基于自身的知识系统和对于对话目标的理解,去生成一个回复。

(3)创业公司的机遇

1)机器翻译方面:经过多年的探索,机器翻译的水平已经得到大幅度提升,在很多垂直领域已经能够在相当大程度上替代一部分人工,机器翻译技术的商业化应用已经开始进入大规模爆发的前夜。

2)应用于垂直领域的自然语言处理技术

避开巨头们对语音交互入口的竞争,以某一细分行业为切入点,深耕垂直领域,对创业公司也是一个不错的选择。

第五部分人工智能在金融行业的应用分析

人工智能产业链包含基础层、技术层、应用层三个层面。基础层的大数据、云计算等细分技术被应用到金融征信、保险、理财管理、支付等金融细分领域;技术层的机器学习、神经网络与知识图谱应用于金融领域的征信与反欺诈、智能投顾、智能量化交易,计算机视觉与生物识别应用于金融领域的身份识别,语音识别及自然语言处理应用于金融领域的智能客服、智能投研;应用层的认知智能应用于金融领域的智能风控。

人工智能在金融行业的典型应用情况

资料来源:创业邦研究中心

第六部分人工智能在医疗行业的应用分析

1.人工智能在医疗行业的应用图谱

人工智能在医疗行业的应用潜力巨大,目前在健康管理、辅助诊疗、虚拟助理、医学影像、智能化器械、药物挖掘和医院管理等领域均有企业在布局,其中医学影像、药物挖掘、健康管理,辅助诊疗、虚拟助理的应用发展速度较快。

图 人工智能在医疗行业的应用图谱

资料来源:创业邦研究中心

2.人工智能在医疗行业的具体应用场景

医学影像。人工智能应用于医学影像,通过深度学习,实现机器对医学影像的分析判断,是协助医生完成诊断、治疗工作的一种辅助工具,帮助更快的获取影像信息,进行定性定量分析,提升医生看图/读图的效率,协助发现隐藏病灶。 人工智能通过影像分类、目标检测、图像分割、图像检索等方式,完成病灶识别与标注,三维重建,靶区自动勾画与自适应放疗等功能,应用在疾病的筛查、诊断和治疗阶段。目前较为火热的应用有肺部筛查、糖网筛查、肿瘤诊断和治疗等。

药物挖掘。人工智能在药物研发上的应用可总结为临床前和临床后两个阶段。临床前阶段:将深度学习技术应用于药物临床前研究,在计算机上模拟药物筛选的过程,包括靶点选择、药效和晶型分析等,预测化合物的活性、稳定性和副作用,快速 、准确地挖掘和筛选合适的化合物或生物,提高筛选效率,优化构效关系。临床后阶段:针对临床试验的不同阶段,利用人工智能技术对患者病历进行分析,迅速筛选符合条件的被试者,监测管理临床试验过程中的患者服药依从性和数据收集过程,提高临床试验的准确性。

虚拟助理。医疗虚拟助理是基于医疗领域的知识系统,通过人工智能技术实现人机交互,从而在就医过程中,承担诊前问询、诊中记录等工作,成为医务人员的合作伙伴,使医生有更多时间可以与患者互动。医疗虚拟助理根据参与就医过程的功能不同,主要有智能导诊分诊,智能问诊,用药咨询和语音电子病历等方向。

第七部分智能驾驶行业分析

1.智能驾驶行业产业链

智能驾驶行业的中心业务是以Google、百度为代表的智能驾驶操纵解决方案提供商和以特斯拉、蔚来为代表的成车厂商。该类厂商,上接上游软硬件提供商,下接公司和消费者,在整个业务链中扮演至关重要的一环。

产业链上游厂商多为细分技术提供商,如深度学习、人机交互、图像识别和新材料、新制造新能源等。

智能驾驶产业链图谱

资料来源:创业邦研究中心

2.智能驾驶市场分析

伴随着 ADAS 技术的不断更新,推断全球 L1-L5 智能驾驶市场的渗透率会在接下来 5年内处于高速渗透期,然 后伴随半无人驾驶的普及进入稳速增长期。在未来的 2025 年无人驾驶放量阶段后,依赖全产业链的配合而进入市场成熟期。预测到2030年,全球 L4/5 级别的自动驾驶车辆渗透率将达到 15%,单车应用成本的显着提升之 外,从 L1-L4 级别的智能驾驶功能全面渗透为汽车产业带来全面的市场机会。

按照 IHS Automotive 保守估计,全球 L4/L5 自动驾驶汽车产量在 2025 年将接近 60 万辆,并在 2025- 2035 年间获得高速发展,年复合增长率将达到43%,并在2035年达到2100万辆。另有接近 7600 万辆的汽车具备部分自动驾驶功能,同时会带动产业链衍生市场的大规模催化扩张。

根据独立市场调研机构 Strategy Engineers 的预测,L4 高度自动驾驶等级下,自动驾驶零部件成本约在 3100 美元/车,其中硬件占比 45%,软件占比 30%,系统整合占比 14%,车联网部分占比 11%。按照全球 1 亿辆量 产规模计算,理想假设所有车辆全部达到 L4 高度自动驾驶水平,那么全球自动驾驶零部件市场规模在 2020 年 将达到 3100 亿美元。

第八部分中国人工智能企业画像分析

随着人工智能技术的不断成熟,人工智能创业的难度逐步降低。创新的大门吸引众多创业企业进入。为了观察行业风向,助力创新企业发展,创业邦研究中心对国内200多家人工智能创业公司进行了系统调研,从发展能力、创新能力、融资能力等多维度指标,评选出“2018中国人工智能创新成长企业50强”。

地域分布

全国88%的人工智能企业聚集在北京、上海、广东和江苏。其中,北京人工智能企业最多,占比高达39.66%;其次是上海,人工智能企业占比达21.55%;位列第三的是广东,人工智能企业占达15.52%。北京以领先全国其他地区的政策环境、人才储备、产业基础、资本支持等,成为人工智能创业首要阵地;华东地区的上海、江苏、浙江均有良好的经济基础和科技实力,人工智能应用实力雄厚,也聚集了一批人工智能垂直产业园;广东互联网产业发达,企业对数据需求强烈,依靠大数据产业链推动人工智能产业发展。

行业分布

从行业大类分布来看,行业应用层的企业占比最大,为56.03%;其次是应用技术层的企业,占比达31.04%;基础技术层的企业占比最小,仅为12.93%。随着人工智能技术的发展,人工智能与场景深度融合,应用领域不断扩展,行业应用公司比重不断提升。在基础层技术方面,国际IT巨头占据行业领先地位, 国内与国际差距明显,中小初创企业很难进入。

从行业应用来看,智能金融企业占比最大,为16.92%;其次是机器人企业,占比达15.38%;位列第三的是智能驾驶和智能教育,占比均为12.31%。金融行业的强数据导向为人工智能的落地提供了产业基础,智慧金融被列入国家发展规划中,庞大的金融市场为人工智能落地带来了发展前景。机器人作为人工智能产业落地输出, 目前市场需求较大,商业机器人占据较大份额。中国智能驾驶市场在资本推动下进入者较多,企业积极推动应用落地,百度、北汽等大型企业尝试商业化落地智能驾驶汽车。人工智能推动教育个性化落地,相关初创企业涉入教育蓝海,推动智慧教育的发展。

收入情况

收入分布在500-10000万之间的企业最多,占比达49.14%;500万以下的企业位居其次,占比达 26.72%;位列第三的是10000-100000万之间的企业,占比为17.24%。

最新估值

企业最新估值均在亿元级别,且分布较为均衡。三成企业估值超过15亿元,还有企业估值达到百亿级别,如优必

选科技、达闼科技和商汤科技等,将来或将跻身人工智能独角兽企业。(备注:分析样本量剔除一半未披露企业)

第九部分典型企业案例分析

1.Atman

企业概述

Atman由来自微软的人工智能科学家和产业经验丰富的产品团队创办,提供专业领域机器翻译、机器写作、知识图谱、大数据智能采集挖掘等语言智能产品,致力于成为医学、新闻、法律等专业领域语言智能专家,为专业领域用户赋能,推动专业领域用户进入人工智能时代,助力专业领域文字智能水平实现跨越式提升。Atman已为强生、新华社参考消息、北大法宝、君合律师事务所等世界领先药企、新闻媒体、法律服务机构开发机器翻译、机器写作、知识图谱、大数据智能采集挖掘等语言智能产品。

目前Atman在北京和苏州两地运营,能快速响应全国各地客户需求。

企业团队

创始人&CEO:马磊

清华大学计算机系毕业,曾先后在微软研究院和工程院担任研究员和架构师,机器学习专家、多次创业者、曾主导多项人工智能重大项目,和申请国际专利共计15+项。

Atman公司核心团队由来自微软、百度、法电等领域高端人才和资深技术人才组成,公司员工40人,其中硕士以上学历占比60%,技术开发人员占比70%,一半以上来自微软亚洲研究院和工程院。

核心技术与产品

技术方面,擅长机器学习(深度学习、强化学习、群体智能)在复杂问题的应用,和国际专利15项,Atman神经网络机器翻译系统于2016年9月首秀,早于谷歌的GNMT,专业领域翻译效果在公测标准和行业客户测试中均持续领先。核心产品为垂直领域机器翻译、机器写作、知识图谱抽取构建、大数据智能挖掘等语言智能产品。

Atman的机器翻译产品可自动翻译编辑专业文献、报告、音视频和网页,支持私有部署和云端混合部署,提供包括数据隐私安全以及自学习的端到端解决方案。

机器写作可对海量数据进行快速搜索、过滤、聚类,根据行业需求自动生成专业文档,适用于所有专业写作场景,可大幅减少专业报告写作过程中的繁复工作,大幅提升专业领域写作效率。

知识图谱可实现海量数据的语义检索、长链推理、意图识别、因果分析,形成一个全局知识库。大数据智能采集挖掘系统为专业领域用户提供智能数据源管理、海量专业数据获取和非结构化数据自动解析并结合知识图谱提供auto-screening、知识重构、专业决策辅助,帮助用户建立强大的以专业大数据为基础的业务辅助能力。

2.黑芝麻

企业概述

黑芝麻智能科技有限公司是一家视觉感知核心技术与应用软件开发企业,2016年分别在美国硅谷和上海成立研发中心,主攻领域为嵌入式图像、计算机视觉,公司核心业务是提供基于图像处理、计算图像以及人工智能的嵌入式视觉感知平台,为ADAS及自动驾驶提供完整的视觉感知方案。

目前公司和博世、滴滴、蔚来、上汽、上汽大通、EVCARD、中科创达、车联天下和云乐新能源等展开深入合作,提供基于视觉的感知方案;除此之外,公司还在消费电子、智能家居等领域布局为智能终端提供视觉解决方案。目前公司已经完成A+轮融资。

企业团队

团队核心成员来自于OmniVision、博世、安霸、英伟达和高通等知名企业,平均拥有超过15年以上的产业经验,毕业于清华、交大、中科大和浙大等知名高校。

创始人&CEO:单记章此前在硅谷一家全球顶尖的图像传感器公司工作近20年,离职前担任该公司的技术副总裁一职,工作内容覆盖了图像传感器研发和设计、图像处理算法研发和图像处理芯片设计。

核心技术和产品

在汽车领域,黑芝麻可提供车内监控方案(DMS),自动泊车方案(AVP),ADAS/自动驾驶感知平台方案。黑芝麻智能科技提供的解决方案包括算法和芯片两个核心部分:黑芝麻感知算法从基础的控光技术,到面向AI的图像处理技术出发来提高成像质量,以及应用深度神经网络训练,结合视频处理和压缩技术,形成从传感器端到应用端的处理过程;黑芝麻芯片平台采用独有的神经网络架构,包括独有的图像处理,视频压缩和计算机视觉模块,与黑芝麻视觉算法结合,采用16nm制程,设计功耗2.5w,每秒浮点计算达20T。

3.乂学教育

企业概述

乂学教育,成立于2014年,是一家网络教育培训机构,采用人工智能和大数据技术,为学生提供量身定制学习解决方案和个性化学习内容。核心团队来自美国Knewton、Realizeit、ALEKS等人工智能教育公司,销售团队有全国40亿toC销售额的经验。

企业自主研发了针对中国K12领域的学生智适应学习产品,其核心部分是以高级算法为核心的智适应学习引擎“松鼠AI”,该产品拥有完整自主知识产权,能够模拟真实特级教师教学。企业发表的学术论文得到了全球国际学术会议AIED、CSEDU、UMAP认可,并在纽约设计了人工智能教育实验室,与斯坦福国际研究院(SRI)在硅谷成立了人工智能联合实验室。

主要产品

学生智适应学习是以学生为中心的智能化、个性化教育,在教、学、评、测、练等教学过程中应用人工智能技术,在模拟优秀教师的基础之上,达到超越真人教学的目的。该产品性价比高,以人工智能+真人教师的模式,做到因材施教,有效解决传统教育课时费用高,名师资源少,学习效率低等问题。

智适应学习人工智能系统

智适应学习人工智能系统模拟特级教师,采用图论、概率图模型,机器学习完成知识点拆分和个人学习画像,采用神经网络、逻辑斯蒂回归和遗传算法为学生实时动态推荐最佳学习路径,实现个性化教育。

业务模式

线上与线下,2B和2C相结合。以松鼠AI智适应系统教学为主,真人教师辅助,学生通过互联网在线上学习课程。开创教育新零售模式,授权线下合作学校,已在全国100多个城市开设500多家学校。

4.云从科技

企业概述

云从科技成立于2015年4月,是一家孵化于中国科学院重庆研究院的高科技企业,专注于计算机视觉与人工智 能。云从科技是人工智能行业国家队,是中科院战略先导项目人脸识别团队唯一代表,唯一一家同时受邀制定人 脸识别国家标准、行业标准的企业。2018年,云从科技成为祖国“一带一路”战略实行路上的人工智能先锋,与 非洲南部第二大经济体津巴布韦政府完成签约。

云从科技奠定了行业领导地位: 国家肯定,国家发改委2017、2018年人工智能重大工程承建单位;顶层设计,唯一同时制定国标、部标和行标的人工智能企业;模式创新,三大平台解决方案,科学家平台、核心技术平台和行业应用平台。

企业核心团队

创始人

周曦博士,师从四院院士、计算机视觉之父—ThomasS.Huan黄煦涛教授,专注于人工智能识别领域的计算机视觉 研究。入选中科院“百人计划”,曾任中国科学院重庆研究院信息所副所长、智能多媒体技术研究中心主任。

周曦博士带领团队曾在计算机视觉识别、图像识别、音频检测等国际挑战赛中7次夺冠;在国际顶级会议、杂志 上发表60余篇文章,被引用上千次。

核心技术团队

云从科技依托美国UIUC和硅谷两个前沿实验室,中科院、上海交大两个联合实验室上海、广州、重庆、成都四 个研发中心组成的三级研发架构。目前研发团队已经超过300人,80%以上拥有硕士学历。

技术优势

全方位多维智能学习模块适应不同场景要求;模块化设计为在工业视觉、医学影像、自动驾驶AR等领域扩展打下良好基础。

云从科技具有高技术壁垒:世界智能识别挑战赛成绩斐然,在CLEAR、 ASTAR、 PASCAL VOC、 IMAGENET、FERA以及微软全球图像识别挑战赛上共计夺得7次世界冠军;在银行、公安等行业智能识别技术 PK实战中,85次获得第一;2018年,云从科技入选MIT全球十大突破性技术代表企业。

在跨镜追踪(ReID)技术上取得重大突破。Market-1501,DukeMTMC-reID,CUHK03三个数据同时集体刷 新世界记录, Market-1501上的首位命中率达到96.6%,首次达到商用水平。

正式在国内“3D结构光人脸识别技术”,可全面应用于手机、电脑、机具、设备、家电。相较以往的2D人 脸识别及以红外活体检测技术,3D结构光人脸识别技术拥有不需要用户进行任何动作配合完成活体验证的功能, 分析时间压缩到了毫秒级以及不受环境光线强弱的影响等诸多优点,受到国际巨头公司的关注。

行业应用

目前国内有能力自建系统的银行约为148家。截止2018年3月15日,已经完成招标的银行约为121家,其中云从科 技中标了88家总行平台,市场占有率约为72.7%;在安防领域推动中科院与公安部全面合作,通过公安部重大课题研发火眼人脸大数据平台等智能化系统,在民航领域,已经与中科院重庆院合作覆盖80%的枢纽机场。

5.Yi+

企业概述

北京陌上花科技是领先的计算机视觉引擎服务商,为企业提供视觉内容智能化和商业化解决方案。致力于“发现视觉信息的价值”。

旗下品牌Yi+是世界一流的人工智能计算机视觉引擎,衣+是时尚商品搜索引擎。公司在图像视频中对场景、通用物体、商品、人脸的检测、识别、搜索及推荐均达到领先水平。

目前公司和阿里巴巴、爱奇艺、优酷土豆、中国有线、CIBN、中信国安、海信、华为、360等数十家顶级机构/产品深度合作,通过提供边看边买引擎、图像视频内容分析引擎、人脸识别引擎等基于视觉识别技术的数据结构化产品服务于海量用户,同时帮助政府机构、广电系统、内容媒体、零售商、电商、视听设备等行业实现智能分析、智能互动与场景营销。目前公司已经获得B轮融资。

企业团队

团队成员来自于斯坦福、耶鲁、帝国理工、新加坡国大、南洋理工、清华、北大、中科院等名校及谷歌、微软、IBM、英特尔、阿里巴巴、腾讯、百度、华为等名企。

创始人&CEO:张默

北京大学软件工程硕士, 南洋理工大学创业创新硕士。连续创业者, 曾任华为算法工程师、微软WindowsMobile工程师、 IBM SmarterCity 架构师,北方区合作伙伴经理,主机Linux中国区负责人,中国区开源联盟负责人,年销售额数亿。 2013年创业于美国硅谷和新加坡,2014年6月在中国设立北京陌上花科技有限公司。

核心技术与产品

技术方面,在国际顶级计算机视觉竞赛ImageNet中,成绩曾超过谷歌、斯坦福等,2015-2016年2年获得十项世界第一。2018年3月,人脸识别准确率位列LFW榜首。Yi+通过遵循无限制,标记的外部数据协议。 Yi+的系统由人脸检测,人脸对齐和人脸描述符提取组成。使用多重损失和训练数据集训练CNN模型,其中包含来自多个来源的约10M个图像,其中包含150,000个人(训练数据集与LFW没有交集)。在测试时, Yi+使用原始的LFW图像并应用简单的L2norm。图像对之间的相似性用欧氏距离来测量,最终取得优异成绩。

公司的核心产品主要包括视觉搜索引擎,图像视频分析引擎以及人脸识别和分析引擎:

行业解决方案

针对营销、安防、相机和电视的不同特点,推出相应解决方案。

营销+AI。场景化广告方案中,大屏AI助理信息流推荐、神字幕、物体/人脸AR动态贴图、video-out、场景化角标与广告滤镜等形式的广告内容推荐,适用于快消、汽车、电商、IT、金融、旅游服务等多个行业。

智慧城市+AI。使用计算及视觉助力智慧城市,在智慧安防、智慧交通、智慧园区等方面提供解决方案。在智慧安防实时识别上,实时处理直播摄像头信息,算法反应敏捷,相应迅速。建立智慧园区方案模型,考虑扩展性&灵活性、数据管理、松散耦合性、安全性、实时整合性以及功能性和非功能性需求等技术方案要素,从业务和技术两方面整合解决方案实现步骤。

电视+AI。电视+AI的解决方案赋予智能电视多样播放能力和营销能力。

相机+AI。相机更具交互能力。用户通过搜索关键字标签同步展示图片,打通相册和购物一站式体验。准确识别人物属性特征,动态适应表情变化,可以在视频以及图像中对人脸实时检测,基于深度学习技术,进行人脸相似度检测,实现面部关键点定位、妆容图像渲染,试用与粉底、唇彩以及眼影等多种虚拟试装方式。实时检测摄像头中出现的物品、场景和人脸等,添加AR效果,SDK支持本地检测、识别、追踪,平均检测帧率可达到25fps。

新零售+AI。Yi+新零售解决方案是基于公司自主研发的人脸识别、商品识别和其他图像识别算法技术为核心,建立一整套基于人脸、商品的智能零售门店管理方案。Yi+新零售解决方案主要包含数据采集、算法模型说明和部署方案三部分,其中数据采集包括人脸数据采集、商品数据采集;算法模型说明包括识别算法训练、商品识别、识别输出;部署方案包括本地部署、云端部署、本地部署与云端部署结合。

6.擎创科技

企业简介

擎创科技成立于2016年,专注于将人工智能和机器学习赋予传统IT运维/企业运营管理,为企业客户提供智能运维大数据分析解决方案,从而取代和改善对高技能运维人员严重依赖的现状。2017年,擎创科技已实现全年2000万营收,迅速成为国内AIOps领域的领跑者和中流砥柱。2018年初,擎创科技完成了数千万人民币的A轮融资,由火山石投资领投,晨晖创投、元璟资本及新加坡STTelemedia跟投。

核心团队

擎创团队的核心成员主要由BMC、微软等美国企业服务上市公司的运维老兵,与新浪、饿了么等知名互联网公司的大数据、算法专家组成,核心团队成员至少拥有10年以上的行业经验。其中CEO杨辰是国内最顶级的B端销售,曾带领团队获得10倍的业绩增长;CTO葛晓波拥有长达15年的企业级软件开发和运维经验;而产品总监屈中泠则来自甲方,创业前为浦发硅谷银行企业架构师,深知甲方对企业运维产品的需求。这个曾经深耕于运维企业服务市场的团队,如今在智能运维企业服务赛道继续领跑,让擎创科技成为最懂企业的客户,最值得企业客户信赖的软件厂商。

主要产品

“夏洛克AIOps” 作为擎创自主研发的大数据智能运维主打产品,自2016年上线以来,已从1.0版本升级至1.9版本,可应用在金融、大型制造业、铁路民航、能源电力等涉及国家发展和民生问题的多种行业。在2017全球运维大会上,夏洛克AIOps获得由中国信息通信研究院与高效运维社区联合颁发的“年度最具影响力AIOps产品”奖。

“夏洛克AIOps”充分利用自研算法辅助客户实现IT运维价值,结合客户的现有情况,规划从传统ITOM至AIOps智能运维的一站式路径,助其运营落地,由此打破数据孤岛,建立统一的大数据智能分析平台,实现以人工智能为核心,驱动传统IT运维监、管、控三个层面,并将相关运维数据及业务数据实时展现。

“夏洛克AIOps”拥有多项自研算法,犹如运维界的福尔摩斯,能迅速发现并定位运维问题的根因,实现秒级排障,最大程度避免企业产生重大损失。更有价值的是,“夏洛克AIOps”还能通过长期的数据积累和机器学习,运用新型深度神经网络算法对企业的业务数据进行预测,帮助企业提前规划IT资源,高效预防各类黑天鹅事件的发生。

商业模式

目前,擎创科技已与多家金融和制造行业标杆客户形成稳定的合作关系,包括浦发银行、浦发硅谷银行、国家开发银行、上海铁路局、银联、海尔、浙江能源等。针对不同客户,采用个性化的商业模式进行服务,目前主要有私有模式和SaaS模式两种,都具有较强的可复制性。

核心优势

人工智能在医疗诊断的应用范文6

若干年前,很难想象一项技术是由人工智能驱动的。

若干年后,很难想象任何技术的背后没有人工智能的影子。

云计算与日俱增的强大威力、运行于深度神经网络的强力算法/丰富多样且来源广泛的数据积累,在这三股强大动力的交织驱动下,我们如今终于有能力实现人工智能的梦想。

把人工智能带给每个人

最近,人工智能开始为大众所关注,但对于科技巨头来说,却早已开始布局。微软在人工智能上的投入由来已久,甚至在业内还被称为人工智能的“黄埔军校”。二十多年以前,微软就已经在构建人工智能的基础,在机器学习、语音识e、计算机视觉、图像识别这些领域中不断地积累起非凡的成就,再加上从云到端涵盖不同行业的广泛的数据研究, 微软今天在人工智能领域的发力,可以说是厚积薄发,水到渠成。

近日,在第九届中国云计算大会上,微软公司资深副总裁、大中华区董事长兼首席执行官柯睿杰(Alain Crozier)表示:“人工智能正在重新定义微软。今天,微软的每一件产品和服务都在融入人工智能,从 Xbox 到 Windows,从必应搜索到 Office。作为一家平台与生产力公司,微软提出了一个明确的目标,人工智能全民化(Democratizing AI) ―― 将先进的人工智能技术转化为每个人触手可及的工具、平台和服务,予力全球每一人、每一组织,成就不凡。”

“人工智能拥有无穷的潜力,它有能力颠覆任何现有的垂直行业,比如银行或者零售业,还有任何单一的业务流程,比如销售、市场或者人力资源和猎头。这样发展下去,人工智能终有一天将有能力为人类的聪明才智锦上添花――增强人类已有的能力,并且帮助人类获得更强的生产力。”微软大中华区副总裁兼市场营销及运营总经理康容在采访中表示。

Azure让人工智能触手可及

两年前,当微软CEO萨提亚 ・ 纳德拉第一次提出“构建微软智能云”时,很多人问,Azure究竟智能在什么地方?

柯睿杰表示:“微软智能云Azure是微软面向未来的三大远见(重塑生产力和业务流程、构建智能云平台、创造更个性化的计算)中至关重要的一环。它既是孕育和发展人工智能的平台和基础,同时也在以多样化的云服务的形式,为全球开发者和企业提供触手可及的人工智能平台与工具。”

康容解释道,微软的想法是希望将人工智能相关的技术和功能完全整合到产品和服务中。微软把人工智能看作是一种底层技术,而不是一个产品。康容打了个比喻,人工智能不是一盘菜,而是一个食材,每一盘菜里都可以放的食材。微软所有的产品线和服务,都会有人工智能的影响力。

“云像是灵魂,但是需要端的躯体,‘云+端’才能真正体现云服务或者人工智能的潜能。”康容表示。

运行在微软智能云Azure上的微软认知服务,是微软最具代表性的人工智能服务,是微软在人工智能领域20多年研究成果的集大成者。微软认知服务所提供的智能API接口增加到了29个,成为业界数量最多,同时也是唯一允许用户自行定制的人工智能服务。微软认知服务覆盖视觉、语言、语音、搜索、知识5个主要应用场景的29项人工智能服务,集成为29个API接口开放出来,让开发者只需要几行代码,就能借助微软的人工智能平台,开发出自己的跨平台人工智能应用。

无论是大型企业还是创业公司,如果使用微软智能云Azure平台,最快一周、最多两周的时间,就可以实现一个完整的技术上的Proof of Concept(POC,即概念验证),然后,加入微软这些人工智能技术,如人脸识别或者语音识别,就可以将这些智能应用加入到任何应用场景中,直接利用现成的功能或者通过定制加工,来打造自己的智能应用和机器人体验。

据了解,自2015年以来,已经有来自60多个国家和地区的超过56.8万名开发者注册使用了微软认知服务。

康容介绍,人脸识别、情绪识别、计算机视觉,这三个微软认知服务的API已经在去年9月在中国提供了预览服务,目前有多家国内客户、开发者和合作伙伴将这些API用于不同的应用场景,并且陆续开发出了成熟的产品。

此外,运行在微软智能云Azure上的Cortana 智能套件,就是一套通过发掘数据智能,帮助企业预测未来发展动向的大数据智能解决方案,它囊括了微软小娜智能助理、大数据管理、数据分析与机器学习、Power BI洞察呈现等众多微软产品和服务。

以云端智能增强生产力

潜移默化间,人工智能正在给各行各业带来颠覆性的变革。

国内知名的云内容加速分发服务商白山云科技有限公司(以下简称白山),利用微软认知服务的视频内容识别功能,开发出了一套为视频直播平台提供实时内容审核功能的智能化解决方案。

白山合伙人兼产品及解决方案副总裁、美国子公司总经理赵鹏表示,白山是国内第一个引入云链服务的企业,主要面向云后市场,为客户提供数据应用服务。面对互联网时代日益激烈的竞争,白山不再满足于提供内容分发服务,而是希望通过引入先进的平台和技术,为客户提供更多附加价值。

赵鹏介绍,白山基于微软智能云Azure的认知服务接口,对客户的视频和图片内容进行识别,规避违规风险。基于微软强大的人工智能技术,白山还在不断发掘新的应用场景,如在监控系统基础之上,不再局限于简单的图片识别,而是对人群的年龄、情绪等信息都进行识别,进而将这些数据整合,用于客户咨询、大数据营销,以及内部整体业务决策等。未来,白山还期待与微软能够在区块链、物联网等领域合作,打造一整套基于云端的完整解决方案。

“成立两年多的时间,白山成长速度非常快,第一个完整财年白山实现了2亿元营收,今年大概增长三倍,做到6亿元营收。”赵鹏表示,白山是站在巨人的肩膀上,才得以如此快速地发展。因为,微软为白山提供的不仅仅是简单的技术支持,更多的是微软构建的庞大生态系统,这都将为白山带来更多的技术资源和客户资源。

联想依靠微软智能云Azure上的机器学习服务,实现了对PC产品出货量的准确预测。

联想CIO部门战略变革总监高汪军表示:“联想在Azure机器学习平台上构建的市场需求数据模型,可以针对全球不同区域市场中庞杂的参考数据进行清洗、筛选、比对和验证,能够在短时间内同时运行多个数据模型,并快速筛选出最优模型和最佳结果。”

目前,该数据模型针对全球大部分PC市场进行的季度出货量预测的准确度,都已经达到甚至超过了专业市场分析机构的预测水平。对联想来说,每一个百分点的市场变化,就意味着数百万台PC的出货量。因此,准确的数据分析和预测就意味着提升效率、降低成本。

说到看病,去医院找医生看病是我们的常识。医生,通过自己的专业技能来看病也是常识。结果如何,全靠医生的判断。如果有了人工智能的应用,会怎样?

有一家中国医疗智能创业企业Airdoc就利用深度学习提升医疗影像诊断的准确度和效率。

对于创业初衷,Airdoc创始人兼CEO张大磊介绍:“一开始并没有想成立一家企业,这是因为身边很多人被‘漏诊’了,后来发现这样的事在全世界普遍存在,我们就在想可不可以用人工智能、深度学习的算法去解决这些问题。就好像养一个小孩,把他派到最牛的专家那里学习,让他学会最牛的专家是如何看片子、看病理、判断疾病,之后把他学会的变成一个简单的算法服务,让所有的医生,包括边远山区的医生都能用上。”

一开始,Airdoc使用了云和机器学习的框架,但性能上总达不到要求。设想一个病人在医生那儿拍了一个CT,如果传到网上后台识别引擎,后台识别引擎要20分钟才能出结果,那病人只能干等。所以,需要做到实时。

“我们了解到微软亚洲研究院正在做微软认知工具包的新版本升级。Airdoc提出了需求,微软通过全球协作为我们提供了全方位的技术支持,Airdoc从原有的深度学习平台迁移到微软认知工具包只用了4天时间就完成了全部迁移工作,Airdoc算法的运行效率提升了近40%。”张大磊表示。

借助微软智能云Azure、微软认知服务和认知工具包,Airdoc能够协助医生更快速、准确地完成糖尿病性视网膜眼底病变(DR)的筛查和分析,显著改善了DR早期确诊率低的问题。

据了解,微软在开源平台的2.0版本的微软认知工具包(Microsoft Cognitive Toolkit),其主要用于生产级和企业级的深度学习工作负载,并简化了深度学习过程,能够与更广泛的人工智能生态系统实现无缝整合。