三十多年前,乡间小路上的“二八大杠”,承载了一名少年对知识的渴望;如今,他站在人工智能(AI)的浪潮之巅,带领全球人工智能“独角兽”,在人工智能赛道上占据一席之地。
他是梁家恩,一名从广西武宣县走出的人工智能科学家和企业家,一位将技术理想扎根于产业实践的创业者。从偏远乡村到中国科学院实验室,从科研攻坚到商业落地,他的个人奋斗史,映射出中国人工智能产业走过的点滴历程。
梁家恩在工作中。
梦想发芽
在武宣乡村,人们常常聚在一起对弈切磋,儿时的梁家恩对象棋很着迷。父亲作为电工站站长,排布线路时专注的样子,也在不知不觉中影响着他。
一次,父亲的同事无意间向他讲述了中国科学技术大学的卓越成就,向往的种子在少年心中悄然种下。每天清晨,他独自踏上崎岖的土路,风雨无阻去上学。下雨天道路泥泞不堪,他不得不扛着自行车,一步步艰难前行。
1996年,梁家恩终于如愿以偿,第一次走出广西,踏进中国科学技术大学的校门。初入大学,便感受到这里与家乡截然不同的科技氛围。
彼时的广西,计算机教育近乎空白,在柳州地区高中读书时,全校仅有的几台“286”计算机是他窥探世界的窗口。而在中科大,全新的学习环境和先进的设施设备,让他如鱼得水。
“室友向我讲述比尔·盖茨的传奇,我听得津津有味,也对计算机领域产生了更加浓厚的兴趣。”
1997年5月,IBM公司的“深蓝”人工智能程序在国际象棋对决中首次战胜顶级大师卡斯帕罗夫。“人机大战”轰动全球,也令梁家恩大受震撼,“我第一次直观感受到了人工智能蕴含的巨大潜力。”
位于北京云知声总部的人工智能展厅。
入局智能
本科毕业之际,梁家恩面临着两个截然不同的选择:是投身航天自动控制应用领域?还是进入当时被称为“模式识别”的人工智能领域?
人工智能的未知,像一片未被开垦的沃土,蕴藏着无限可能,深深吸引着梁家恩去发掘、去探究。“我享受这种探险的感觉。”经过深思熟虑,他选择了后者。
2001年初,梁家恩进入中国科学院自动化研究所进行硕博连读,师从当时国内人机交互领域语音方向最顶尖的“863计划”专家、现任中国科学院自动化研究所所长徐波,深耕语音交互,“徐老师告诉我们,人与机器交互,最自然的方式是语音、语言”。
当时,国内从事人工智能研究的高校和科研机构屈指可数,且大多停留在理论研究层面,产业化应用相当有限。毕业后,梁家恩选择留在中国科学院自动化所高技术创新中心,致力于将人工智能技术应用于广播电视及安全、教育等多个领域。
他参与的“初中英语听力口语自动化评估系统”项目首次将AI技术规模化应用于严肃考试场景,是当时最具挑战的项目。三天内完成百万考生口语评测,分数计入中考成绩,不仅提高考试效率,还节省大量人力,“项目最后大获成功,在江苏、浙江温州正式启用,成就感非凡”。
然而,在技术应用的商业化进程中,他却遇到了难题:“研究所更侧重于科研工作,对商业化的重视程度还不够,导致科研成果与产业应用之间存在明显鸿沟。”
梁家恩陷入思考,实验室成果如何真正改变社会,走上产业化道路?
2011年初,他决定离开原有体制,加入盛大创新院。仅过了一年多,他便敏锐地察觉到,创业的大门已悄然敞开。
云知声在厦门布局的人工智能超算中心。
深海创业
2012年,梁家恩与中科大的师兄弟创立云知声。
创业初期,团队成员不到10人,均出自中科系。多人毅然放弃了体制内的稳定工作,拒绝了大公司的橄榄枝,怀揣着学以致用的理想,决心在人工智能产业化道路上走到底。
由于一直专注于语音技术,他们决定从语音领域起步。当时,深度学习技术初露锋芒,与传统的统计学习方法截然不同。梁家恩及其团队敏锐地捕捉到了这一技术优势,果断决定转型,将技术方案切换到深度学习。2012年底,云知声成功将深度学习技术产业化,成为国内率先将深度学习算法应用于语音识别产品的企业之一。
他们通过提供语音交互解决方案来开拓市场,仅用一周时间就在微信上开发了首个语音输入插件,迅速登顶App Store榜首。许多“巨头”企业成为客户,云知声在AI江湖崭露头角。
然而,科研与创业的巨大差异,让这支年轻团队迎来更大挑战。
搞科研时,有明确的场景和充足的资源支持;而创业,则需要考虑商业模式、团队搭建、技术路径选择以及融资等一系列复杂问题。“这种差异就像游泳一样。”梁家恩说,“过去我们在泳池里游,现在我们在大海里游。在泳池里总有各种设施保护我们,但在大海中,我们只能依靠自己前行。”
破釜沉舟
真正的考验在2016年来临。
阿尔法Go击败围棋世界冠军李世石,引发全球对人工智能深度学习的高度关注。围棋的变化极其复杂,这场胜利比当年“深蓝”击败卡斯帕罗夫难度更大。电脑战胜围棋高手?过去大家认为根本不可能的任务,阿尔法Go通过深度学习“搞定了”。
这一事件让梁家恩敏锐地意识到,云知声不能仅仅局限于传统语音交互,必须进行战略转型。人工智能的战场已从“单点突破”转向“生态竞争”。基于团队成员在工业界5年以上的工作经验,他们对工业趋势的把握更加前瞻,“必须深入行业核心,成为全栈AI服务商。”
除了推进传统技术产品的量产,还要进行未来布局,这是梁家恩创业以来最艰难的时刻。团队顶着投资人的质疑压力,同时推进了三大项目:语音交互方案开发低成本智能交互专用芯片、跨界医疗领域打造医疗知识图谱和解决方案,以及布局大型智算集群。
“阿尔法Go的训练过程需要调度上千块GPU进行工作,要想发展技术,算力必须升级。”
梁家恩马上带队前往美国硅谷,与硅谷顶尖企业的超算专家进行交流。“当时很多人认为我们仅成立4年就想布局超算平台,为时尚早。然而随着后期大模型的相继涌现,他们改变了观念,夸赞我们确实布局早、有远见。”
云知声随即在厦门布局建设人工智能超算中心。目前,其智算平台已达到超30亿亿次每秒的浮点计算能力,发展速度惊人。
“如果没有当年的破釜沉舟,现在我们连参赛资格都没有。”2023年,当ChatGPT掀起通用大模型浪潮时,云知声因智算集群的超前布局,迅速跻身赛道。
“那时我们坚信,人机语音交互在未来一定占据半壁江山。今天看来,可能它不止半壁江山,未来会成为一个标配。”
2023年5月,基于自建300P算力的智算平台,云知声发布了自研的千亿规模多模态大模型“山海”。智慧医疗、智慧政务、智慧交通……“山海”已经全面接入并重塑云知声现有的各类人工智能应用场景,开展了落地示范。
抓实干,放手做,在实际工作中不断迭代团队能力,提升效能,将理论转化为实际成果,他们做到了。云知声在北京、上海、合肥、深圳等地设立子公司,各团队根据自身优势和市场需求,在医疗、教育、交通、物联网、家电和车载等领域展开布局,不断拓展业务边界。
■人物小传
梁家恩博士,广西武宣人,正高级工程师,云知声创始人/CTO
北京市科委/中关村管委会专家库成员,模式识别国家重点实验室技术委员会委员,北京市新的社会阶层人士联谊会常务理事,福建省人工智能协会主任委员;先后获得“中国AI创业领军20人”“中关村创新创业青年英豪”“全球科学企业家50人”;累计申请发明专利190项,获“吴文俊人工智能科技进步奖”“北京市科技进步一等奖”“厦门市科技进步一等奖”等荣誉奖项。
2012年与合伙人共同创立的云知声智能科技股份有限公司,曾获“国家级专精特新‘小巨人’企业”称号;2018年起连续六年上榜CB Insights全球人工智能独角兽榜单,成为其中唯一的国内对话式AI独角兽。
2025年2月28日《广西日报》版面截图。
原标题:桂籍英才库|山乡游子勇立AI潮头 “我享受这种探险的感觉”