1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就热情地将“大数据”称颂为“第三次浪潮的华彩乐章”。2009年,随着思科、威睿、IBM 等公司倡议,大数据概念逐渐兴起。近日,记者走访了高新区的多家人工智能企业,了解大数据对于多个“人工智能+”行业的作用和帮助。
敢于拓荒 大数据广泛应用于人工智能产业
随着当下人工智能迅速发展,快速获得一个事件的大概轮廓和发展脉络变得尤为重要,处理海量信息成为了在突围成功的重要法宝。大数据的运用就尤为关键。
高新区蚁坊软件在创办早期,就将公司定位为大数据的“拾荒者”与“淘金者”。基于分布式采集框架和实时处理框架上的优势,蚁坊软件总经理刘涛决定将社交网络大数据作为主营方向,打造了一个特色鲜明的大数据服务云——“蚁工厂”,通过大数据为企业提供舆情监测、数据采集分析、制作解决方案等一系列SaaS服务。
走进蚁坊软件的办公室,随处可见的LED屏幕上显示着#屠呦呦团队青蒿素新突破#、“屠呦呦团队”等一系列互联网热词分布图,并可以实时看到同名话题热度。刘涛向记者介绍,这说明该事件是当天最热门的舆情事件,实际上蚁工厂会实时将各个舆情事件分类为若干个标签进行自动化处理,让相关人员可以第一时间发现网络上发生的舆情事件,并快速形成舆情简报。
“我们能做到在每天超过4亿条互联网数据入库的同时,保证索引和查询的响应时间为秒级。”刘涛向记者展示着“蚁工厂”的后台数据,比如以全网数据为基础建立社会情绪分析系统、迅速在近三个月的所有社交网络中检索出符合特定条件的信息等等。
除了实时监测和分析,大数据在智慧生活中还大有作为。在梦洁家纺,董秘李军同记者说起梦洁剑指智造4.0的秘笈:“我们建立了一个大型的数据库,基于大数据,电脑可以自动算出产量、产品、工艺以及工人工资等等,根据这个系统,我们匹配了独有的生产线,目前公司已经投资2000多万元,改造了11条生产线。”
湖南万为智能机器人则用大数据来训练安保机器人“Anbot”巡逻避障的能力。“我们用雷达加上大数据分析来训练机器人的避障能力,同时用大数据来教会机器人处理很多应急事件,让安保机器人更像保安。”万为机器人总经理李金波说道。
在智慧医疗领域,自兴人工智能研究院用人类染色体核型智能分析云平台AICKS来检查人类染色体的数量和带纹结构是否正常,进而确定是否患有疾病。而AICKS最大的特点是用百万量级染色体的大数据来“喂养”人工智能,它能够进行自主学习,不断优化,提升检测准确率,识别准确率高达98%。
同样,不论是在智能家居、智慧出行,还是在人脸识别、步态识别方面,大数据作为内容支撑,为人工智能应用的发展赋能添智。
破除壁垒 让“数据湖”技术更好地服务生产生活
“互联网时代数据就好比是水,这些水汇聚到数据湖里,通过相关的处理和分析就能变成面向不同用户的数据报告和应用。数据湖的价值就是存储一切、分析一切、创建所需,推动信息化建设从应用驱动转变为数据驱动。”对于大数据的未来,刘涛十分看好。
数据湖的核心价值是为企业带来了数据平台化运营机制。当前很多企业尚未意识到数据平台化为企业带来的好处。当今的商业环境,在日新月异的技术变革驱动下,正发生着剧烈的变化,传统行业被互联网公司颠覆,给很多公司造成了极大的生存压力。
Google以及Facebook等很多公司都开始推广“数据湖”技术。“数据湖”好比一个大量级的数据收纳集合,这其中包括了点击流数据、物联网数据、日志数据等等。
对“数据湖”,专家曾有一个形象的说法:过往的应用驱动就好比因为某个目的而收集相关数据,这是为了达成某个应用目标而进行的工作。而数据驱动则是将许多看似联系较少的数据整合在一起,从中选取有用信息、抓取联系,在数据分析中找寻新发现和新成果,这就是数据驱动。
“将许多看似无关的数据联系在一起,可能会产生许多奇妙的化学反应。创新成果,就是突破常规而来的。”刘涛期许未来的数据壁垒能够进一步破除,真正将数据连接成“湖”,让更多优秀的成果、更新颖的智慧生活方式涌现出来。
(部分文字、图片来自网络,如涉及侵权,请及时与我们联系,我们会在第一时间删除或处理侵权内容。电话:4006770986邮箱:zhangming@eefung.com负责人:张明)