|新一代信息技术 信息基础设施建设 互联网+ 大数据 人工智能 高端信息技术核心产业
|高端制造 航空航天 轨道交通装备 海洋工程装备 新材料
|生物产业 生物医药 生物农业 生物能源
|绿色低碳 清洁能源汽车 新能源 节能技术 环境保护
|数字创意 数创装备 内容创新 设计创新
您的位置:首页 > 数字创意 > 内容创新
数字替身:探索人生的无数可能
2018-10-17 10:10
来源:《光明日报》
字体: [   ]

  我们对于未来化场景的大多想象都是基于高度的自动化,但是每个人的生活习惯不同,所以每个人需要的自动化程序都不一样。那么,美好的未来生活怎么才能让每个人的自动化程序都合你的心意呢?

  也许,你需要的仅仅是一个数字替身,它是“电子化”的你,了解你的一切生活习惯。这个替身会成为你的助手和管家,把你的工作和生活中按部就班的部分安排得井井有条。

  事实上,人工智能最可能导致的情景就是“数字替身”的大量出现。“数字替身”是我们自身的虚拟模型,这些模型可以在各种各样的模拟中互动,帮助我们在日常生活中做出更快速、更全面的决策。如今的各种语音助手音箱已经是这个替身的雏形。人工智能将服务于人类,而不是控制人类。

  1.从制造机器到机器学习

  人类是唯一可以制造机器的动物。通过这种方法,我们扩展了自身的能力,超越了我们的生物极限。工具使我们的双手变得万能。汽车让我们行进得更快,飞机给了我们翱翔的翅膀。计算机赋予我们更强大的智力和记忆力,智能手机为我们安排日常生活。而现在,我们正在创造一项全新的技术,用代码赋予它通过数据和练习进行学习的能力,使其可以实现自我进化。它会最终取代我们吗?还是将以史无前例的方式提升我们的能力,增强我们的人性?

  机器学习源于20世纪50年代部分科学家的开创性工作,如弗兰克·罗森布拉特(Frank Rosenblatt)设计了一种能够识别数字的电子神经元,阿瑟·塞缪尔(Arthur Samuel)开发了一种跳棋程序,可以通过和自己对弈来学习,并最终击败人类选手。但也仅仅是在过去十年,机器学习领域才开始真正腾飞,为我们带来了自动驾驶汽车、能(在一定程度上)理解我们指令的虚拟助手等各式各样的应用。

  每年,我们都会开发数以千计的新算法。所谓的算法,就是用来指导计算机完成某些操作的指令序列。而自我学习机器的核心特点是,我们不需要为它们编写具体的程序,只需要给它们一个诸如“学习如何玩跳棋”的宽泛目标,接下来,机器就可以像人类一样,通过积累经验而不断优化。

  对人工智能的追求可以看作是人类自我进化的一部分。自动化技术发展的下一阶段是发明出所谓的主算法,将把当前的5种机器学习方法整合为统一的框架。技术只是人类能力的拓展。除了达成我们给予的任务目标,机器并没有自由意志。我们应该担心的是人类对技术的滥用,而非被机器夺走了控制权。

  现在机器学习算法大致可以分为5个大类,每一类都是从不同的学科领域获得了灵感。并不让人意外的是,有一种机器学习方法就是在模拟自然选择,我们称这样的算法为进化算法。例如,在哥伦比亚大学的创新机器实验室(Creative Machines Lab)中,有许多雏形机器人在尝试爬行或飞行,其中表现最优异的结构将定期融合和变异,产生新一代的3D打印样机。一开始这种随机组装的机器人几乎无法运动,但经历了数千次的迭代后,这种方法已经产生了类似蜘蛛或蜻蜓的机器人。

  但这种进化是低效的。当前应用最广泛的机器学习方法是深度学习,它的灵感来自大脑。这种方法从模拟单个神经元功能的高度简化的数学模型出发,构建出包含数千个神经元的网络,并通过学习不断调整不同神经元之间的连接。如果两个神经元在处理数据时同时放电,它们之间的连接就会加强。这样的神经网络能以极高的准确度识别人脸、理解语音和翻译语言。机器学习也会借鉴心理学。与人类相似,这种以类比为基础的算法通过在已有的数据中寻找近似的问题来解决新的问题。这种特性可以实现自动化的客户服务,也可以让电商网站基于用户个人习惯推荐商品。

   2.努力创造一个主算法

  通过自动执行科学方法,机器也可以实现学习。为了引入新的假设,所谓的符号学习会进行逆向推理演绎:如果我知道苏格拉底是人类,要推断出他会死,我还需要知道什么信息?知道人会死或许就足够了,而且这个假设可以通过检查样本中其他人类是否会死来进行确认。英国曼切斯特大学的生物机器人Eve便是通过这种方法发现了一种有可能治疗疟疾的新药物。根据疟疾的相关数据和基本的分子生物学知识,Eve提出了什么样的药物可能具有疗效的假设,还设计了实验并在机器人实验室进行测试,然后修改或放弃一些假设,不断重复上述过程直到取得满意的效果。

  最终,机器学习可以完全构建于数学原理之上,其中最重要的是贝叶斯定理。按照这个定理,我们可以基于现有知识,先给不同假设指定初始概率,然后提升与数据相符的假设的概率,并降低与数据不符的假设的概率,最后计算所有假设的加权平均值,就可以作出预测:概率越高的假设,权重也越高。基于贝叶斯定理的机器在某些医疗诊断中的准确率要高于人类医生,也是很多垃圾邮件过滤系和谷歌个性化广告推荐系统的核心技术。

  这5类机器学习算法,每一种都既有优势,也有不足。例如,深度学习在解决视觉或语音识别等感知任务上性能卓越,但无法处理常识的获取和推理等认知任务。而符号学习则与之相反。尽管相比于神经网络,进化算法可以解决更为困难的问题,但解决这些问题要耗费大量的时间。类比方法可以从少量的数据实例中学习,但面对过多信息时却容易陷入混乱。贝叶斯学习是处理少量数据的最有效方法,但处理海量数据时却代价高昂。

  因为不同的方法各有利弊,所以机器学习研究者一直致力于把各种方法的优势结合起来。就如同一把能打开所有锁的万能钥匙,我们也在努力创造一个所谓的主算法(master algorithm)——这个算法可以从数据中学习到一切特征,提取出所有可能得到的知识。

  当前,机器学习领域面临的挑战和物理学家面临的挑战类似:量子力学可以在微观尺度上很好地描述宇宙,广义相对论则适用于宏观尺度,但这两个理论却是不相容的,有待调和。在粒子物理学的标准模型建立起来之前,詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)首先统一了光、电和磁;与此类似,包括我和华盛顿大学的同事在内,很多研究团队都提出了将两种或多种机器学习方法统一到一起的思路。但科学进步是断断续续、非线性发展的,因此很难预测这个大一统的主算法什么时候才能实现。不管怎样,这一目标的实现并不会导致一个全新的、强大的机器种族出现,相反,它会促进人类的进步。

12>>>
关注微信公众号:

关于我们 | 联系我们 | 广告刊例 | 订阅服务 | 版权声明

地址(Address):北京市西城区广内大街315号信息大厦B座8-13层(8-13 Floor, IT Center B Block, No.315 GuangNei Street, Xicheng District, Beijing, China)

邮编:100053 传真:010-63691514 Post Code:100053 Fax:010-63691514

Copyright 中国战略新兴产业网 京ICP备09051002号-3 技术支持:wicep