|新一代信息技术 信息基础设施建设 互联网+ 大数据 人工智能 高端信息技术核心产业
|高端制造 航空航天 轨道交通装备 海洋工程装备 新材料
|生物产业 生物医药 生物农业 生物能源
|绿色低碳 清洁能源汽车 新能源 节能技术 环境保护
|数字创意 数创装备 内容创新 设计创新
您的位置:首页 > 其它 > 独家内容
科大讯飞 要有坐好十年冷板凳的韧性 | 新足迹
2018-02-09 00:02

本文首发于201821

 

《中国战略新兴产业》

本刊记者 卜文娟 编辑整理

  在安徽合肥,他带领创业团队蜗居在租来的民房中,“捧”起了中国语音产业的新星科大讯飞。他,就是刘庆峰。

  当时,国际 IT 巨头已开始觊觎中国语音市场,IBM、摩托罗拉、微软、英特尔相继在中国成立实验室,但语音产业化始终难成。在国内,诸如社科院、中科院等高校实验室虽酝酿语音技术多年,也依然不能达到商用标准。更为严峻的是,由于国内研究团队被大批挖角,国外公司几乎抢占了整个中国语音市场。

  在这样的背景下,1999 年毕业后,刘庆峰召集起了同一实验室的一帮师弟以及科大 BBS 中最优秀的版主,加上中科大的投资,搭建起了科大讯飞最早的班底。要让电脑“能听会说”、要将语音技术产业化是刘庆峰创办公司前给导师王仁华提的条件之一,在当时计算机还未普及的时代,这样的想法几乎是异想天开。

  “当时我们拿到了第一笔 3000 万元的融资,并利用这笔钱将国内语音技术比较好的中科大、中国科学院声学所和中国社科院语言所的资源整合在了一起。这是业界和学界多少年想做都没做成的事情。”刘庆峰说。

  不过,就在公司成立的第一年,以技术见长的刘庆峰迎来了创业路上的第一次重创。当时,科大讯飞开发出一款电脑桌面软件,试图把手写输入的随意性、键盘输入的准确性和语音输入的高效性完美结合起来,用语言控制电脑。但随后的市场效果却让大家大跌眼镜。“用户自己操作的满意度瞬间降至 30%,投入的资金血本无归。”

  惨败之后,经过公司讨论,刘庆峰决定放弃当时的 B2C 模式,转向为有渠道、有市场的大公司提供核心技术的 B2B 业务。“科大讯飞只负责开发引擎、语音合成和语音识别芯片,而应用集成则由下游的开发商或客户自己完成。这一模式也就意味着越来越多的市场主体进入语音的产业链当中。”

  定位确定后,刘庆峰和他的团队抓紧时间进行系统修改测试。终于在 2001 年,柳传志将联想进入风投产业后的第一单投给科大讯飞。资本有了,技术有了,商业模式也有了。但是直到 2003 年,科大讯飞一直没赚到钱。“这是科大讯飞第二个最艰难的时期。”刘庆峰回忆。

  2004 年,在语音市场上咬牙坚持了 5 年的科大讯飞终于扭亏为盈,开始进入发展的快车道,也摸索出一条自己发展的道路,在技术转化为资金、回应市场需求方面都有了长足的进步。

  2008 年,科大讯飞的成绩可谓斐然:成为中国语音产业界第一家上市公司,语音产业基地破土奠基,夺得国际英文合成大赛 2006-2008 年三连冠,并获得国际说话人识别评测大赛(NIST2008)第一名。这些成绩的取得归功于公司对技术创新的重视。

  正是准确定位以及对未来的判断,科大讯飞的发展空间变得异常广阔。目前,语音识别技术广泛应用于信息安全、电信、金融、教育、农业等领域。科大讯飞的产品,在中文语音识别的主流市场应用中占有 80%以上的份额。

  2017 年 6 月,《麻省理工科技评论》发布当年全球 50 大最智慧公司榜单,科大讯飞首次入榜,名列全球第六、中国第一。同年 12 月,中国科技部确定依托科大讯飞建设认知智能国家重点实验室,成为人工智能领域首个国家级重点实验室。实验室主要两个方面的基础研究工作:一是基于深度学习的认知智能,另外一个是人类知识的组织和运用,包括知识图谱建设等。

  此外,实验室还会以教育、司法、医疗、车载、客服、智能家居等领域产业应用需求为牵引,重点开展面向认知计算的深度学习共性技术、知识自动构建与推理技术等认知智能基础理论的研究,突破人机交互技术、智能评测技术、智能辅助审判技术和认知医疗技术等认知智能支撑技术。

  “Robot, can you play my favourite music–Dance of Golden Snakes?”“你是说金蛇狂舞吗?”这是发生在 2017 广州《财富》全球论坛晚宴上的一幕对话。该晚宴的举办地设在广州传统中轴线的核心地标中山纪念堂,当晚文艺演出以《丝路之光》为主题,采用传统与现代相结合的方式,讲述广州故事。在现场,小女孩用一口流利的英语和机器人交流,机器人立即用中文回应。

  据悉,该款机器人是科大讯飞自主研发的智能服务机器人“晓曼”。它集成了全球领先的 AIUI 技术,支持语音、触屏、动作等多模态交互模式,提供了更贴近用户的优质交互体验。

  同时,基于科大讯飞深度学习的人脸识别方案,“晓曼”支持人脸检测与定位,人脸跟踪、活体检测等功能,人脸识别成功率 90%以上。晓曼不仅可以与人进行中英双语“对话”,还能够“听懂”21 种方言口语,是科大讯飞依靠先进的人机交互能力,打造的“能听会说”、“能理解会思考“的机器人应用标杆。

  在智慧医疗领域,目前科大讯飞的布局主要分三个方向,智慧医院,智医助理、人工智能辅助诊疗中心。虽然人工智能目前在各行各业已经交出比较满意的、令人信服的答卷,但在医疗领域,人工智能一直备受争议,有的人觉得人工智能医疗华而不实。

  科大讯飞智慧医疗常务副总经理鹿晓亮认为,人工智能+医疗并不容易,要有愿坐十年冷板凳的韧性才有可能成功,不是投入一两年就可以成功的,没有五到十年的坚守,不可能把这个事情做起来。

  前不久科大讯飞的智医助理以 456 分的成绩通过医师资格证考试,成为全球首个通过国家临床执业医师综合笔试测试的机器人。其实,科大讯飞早在 2015 年的时候就已经开始布局医疗了,科大讯飞医疗咨询经理丁兢娜表示其对于医疗方面的投入量非常大。“我们的产品都涉及到机器学习,而机器学习、深度学习需要不断学习。所以无论是智医助理类还是图像识别的产品,都面临着一个终身学习的过程,我们对其中的研发的力量的投入只会多不会少。”

  在汽车领域,近日,科大讯飞与广州汽车集团股份有限公司签署战略合作框架协议,双方将在智能人机交互技术、车载智能化及人工智能技术、大数据分析、智能车联网平台、广告投放、智能客服、智能销售机器人及营销创新等业务领域展开合作。这是继 2017 年 11 月与北汽签署战略合作之后又一与大型车企签署的战略合作协议。

  双方将基于智能语音技术联合开发车载终端产品及车载应用平台。此外,将助力广汽集团建立车载终端平台化标准,共同定义广汽集团统一的车联网体系标准、技术框架和路线。基于 AI 技术与大数据应用服务能力,双方将共同搭建企业级大数据平台,为广汽集团提供业务场景数据支持、营销策略分析、营销投放评估等方面的创新。

关注微信公众号:

关于我们 | 联系我们 | 广告刊例 | 订阅服务 | 版权声明

地址(Address):北京市西城区广内大街315号信息大厦B座8-13层(8-13 Floor, IT Center B Block, No.315 GuangNei Street, Xicheng District, Beijing, China)

邮编:100053 电话:010-63691650 传真:010-63691514 Post Code:100053 Landline:86-010-63691655 Fax:010-63691514

Copyright 中国战略新兴产业网 京ICP备09051002号-3 技术支持:wicep