Daisyfight 2019-03-27
3 月 27 日,2019 云知声 AI 技术开放日(Open Day)首站在北京成功举办。由云知声董事长/CTO 梁家恩博士领衔,十余位一线 AI 行业专家先后登台,做了覆盖技术、学术与产业的精彩分享,活动吸引逾五百名 AI 行业精英到场。
Open Day 是云知声一年一度的对外进行技术分享与交流的活动,是云知声面向人工智能硬核科技,与合作伙伴、相关学术和产业研究机构等共话人工智能前沿技术与产业应用并探讨合作的平台。2019 首届云知声 Open Day 设北京、深圳、上海、厦门四站。继北京站之后,深圳站将于 4 月中旬正式开启。
聚焦 AI 技术人员,北京站活动以“AI 技术与应用”为核心,在“云知声全栈 AI 技术发展”主论坛之外,还设置“知识图谱”与“AI 芯片”两大平行分论坛。围绕人工智能技术发展与产业实践,为产业人士带来前沿技术、优秀产品及行业应用全方面的解读。
秉承“只讲干货”的原则,大会除云知声董事长/CTO 梁家恩、副总裁李霄寒、AI Labs 资深专家刘升平、AI Labs 资深专家关海欣四位技术专家之外,还邀请到中科院自动化所、中科院软件研究所、寒武纪、NextVPU(肇观电子)、比特大陆、文因互动、达观数据等多位国内 AI 领域领军科研机构与企业的重磅演讲嘉宾,就所在领域的研究成果与技术发展进行分享。密集的 AI 干货输出,让与会者大呼过瘾。
AI 理性回归,全栈能力建设成决胜关键
模式识别国家重点实验室主任刘成林在上午的活动开场致辞中指出,在当下 AI 技术驱动的产业变革浪潮中,要服务好消费与产业升级的需求,技术与应用的挑战十分艰巨。对于 AI 企业而言,需建设更加全面的技术体系,才能不断适应并满足场景化的实际问题,保持自身的行业优势。
作为活动的首位分享嘉宾,云知声董事长/CTO梁家恩博士在题为“理性时代的 AI 技术与产业展望”的主题演讲中,分享了自身对于行业的理解与思考,并提纲挈领地解构了云知声覆盖感知、认知与表达的全栈 AI 技术图谱,贯穿技术、产品与产业闭环的全栈 AI 产业能力,以及从底层算法到 AI 芯片的硬核实力。
梁家恩博士指出,云知声很早就搭建了被誉为云知声版“TensorFlow + GKE (Google Kubernetes Engine) ”的 Atlas 机器学习计算平台。基于该平台,向上支撑起信号(AEC/SSP/ISP)、语音(ASR/TTS/VPR/CALL)、语言与认知(NLU/NMT/SDS/ICI)、图像(FID/OD/OCR)等多技术领域的横向扩展和纵向迭代。通过将能力封装在自研 AI 芯片之上,云知声打磨了“云端芯”一体化产品体系,落地“AI+生活(家居、车载、机器人等)”与“AI+服务(医疗、教育、政务、酒店等)”两大核心场景,继而贯通云知声从 AI 技术到产业应用的生态闭环。
“在全栈能力与硬核科技双轮驱动下,云知声定位需求与问题,致力于打通技术创新到产业应用的闭环,解决产业规模化应用的关键问题。” 梁家恩博士指出。
随后,云知声副总裁/芯片研发负责人李霄寒博士,云知声 AI Labs资深专家刘升平、关海欣,先后带来云知声 AI芯片、知识图谱、语音降噪等相应领域的技术分享。
过去的 2018 年被行业称为 AI 芯片的元年,传统与新秀纷纷拍马杀到,一时间烽烟四起。本次活动上,李霄寒博士从 AI 芯片设计的挑战、设计维度以及核心技术等方向,分享了云知声对于 AI 芯片行业和技术的看法。
他认为,针对人工智能的芯片设计,面临着碎片化场景、冯·诺依曼内存墙、边缘侧应用的低功耗需求、安全需求四大挑战。在芯片设计上,需面向具体场景,基于端云互动的思想提供多模态处理的能力,在性能、功耗、面积上达到优异平衡,并兼顾连接和安全的需求。
他介绍到,解决冯·诺依曼内存墙这一行业共同难题,关键在于拉近计算单位和存储单位的距离,让它们尽可能接近。为此,云知声提出了异构计算系统架构设计、加速器近算存储结构,以及通用API函数到专用指令集的多重应对方案。与此同时,通过技术攻坚,云知声推出的低功耗语音唤醒技术,以及面向机器视觉专用的低功耗microISP,可很好地适应边缘侧应用的低功耗需求。而定制的安全 IP 规划,则可满足安全性方面的要求。
围绕人机交互对话系统,云知声 AI Labs 资深专家刘升平介绍了云知声在这一领域的典型技术与进展,包括流式交互、语用计算与知性会话。他指出,云知声从 2013 年开始发力语音交互系统,为实现真正的智能,在 2016 年云知声正式提出流式对话方案,并在行业率先实现多次对话中的免唤醒;同时,云知声提出的语用计算技术,可以从语用而非直接从语境的角度去理解说话人意图。结合更丰富的语义,可更好地理解语音输入的真正含义;此外,云知声还把知识引入到对话过程中,让知识图谱全程参与整个对话过程,包括聊天、问答,都由知识图谱来支撑,赋予机器聪明头脑。
从远场语音识别的前端信号处理技术出发,云知声 AI Labs 资深专家关海欣分享了云知声针对这一领域的创新解决思路。他表示,解决远场语音识别的关键点在于远场拾音,需从前端的信号处理阶段入手,妥善处理好回声、混响、噪声等三个核心问题。在回声消除、混响抑制、噪声处理等方向,云知声已有领先的成熟技术方案,相关技术指标均达行业高水准。
AI 芯片百花齐放,云端、边缘侧殊途同归
AI 芯片分论坛中,云知声副总裁李霄寒、寒武纪副总裁刘道福、NextVPU(肇观电子)联合创始人陈涛、比特大陆算丰 AI 产品线总裁阮沈勇四位嘉宾结合各自公司的业务方向,就 AI 芯片的关键技术、设计难点与场景应用进行了分享。
李霄寒认为,IoT 结合 AI 化浪潮,需要全新的 AIoT 芯片,多模态 AI 芯片是关键一步。AI 与 IoT 的叠加要求传统解决方案朝五大方向转型:从通用架构-AI架构、从依赖硬件到软硬件一体、从 PPA 模式到垂直场景模式、交互从单模态转向多模态、设备从独立到协同。为此,云知声提出 Skills On Chip 概念,打造了 DeepNet2.0 多模态神经网络处理器 IP,可兼容多种神经网络。
寒武纪公司副总裁刘道福结合自身产业经历,多角度分析了智能芯片该如何做到好用和通用。他认为,设计灵活的指令集,设计可扩展性强/高效的架构,提供灵活的运算器方案,支持主流编程架构,在大规模商用中得到反馈和修正等均是做好智能芯片的重要手段。
NextVPU 联合创始人陈涛重点介绍了其 AI视觉处理器芯片N171。他介绍,N171是一款高度集成的SoC芯片,可作为主芯片独立运行操作系统,还可为计算机视觉定制特殊的视觉成像引擎,可广泛用于机器人、无人机、无人车等方面。
去年年初,比特大陆发布云端 AI 芯片品牌“算丰”,并按照 9 个月的速度进行产品发布和迭代。在下午的分论坛上,比特大陆算丰 AI产品线总裁阮沈勇介绍了比特大陆量产深度学习加速卡 SC3。他透露,今年上半年比特大陆还将推出第三代芯片 BM1684,BM1684 的芯片会在处理路数以及接口上有大幅度提升。
知识图谱,打造行业专家人设
在下午的分论坛中,云知声 AI Labs 资深专家刘升平、中科院自动化所副研究员刘康、中科院软件研究所研究员韩先培、文因互联创始人/CEO 鲍捷、达观数据创始人/CEO 陈运文,围绕该领域所面临的技术挑战以及应用前景展开了讨论。
刘升平指出,知识图谱是人工智能时代打造面向酒店服务、家居生活、儿童教育等不同场景行业专家的基石。结合在医疗领域的产业实践,刘升平分享了知识图谱的构建方法与构建流程。他认为,在构建知识图谱时,一定要看行业历史上的知识表现方法,通过借鉴这些方法来降低成本;另外一定要应用驱动,而且一定要选好知识图谱的评测方法。
中科院自动化所副研究员刘康、中科院软件研究所研究员韩先培两位嘉宾则分别结合自身的研究方向,分享了自然语言理解、知识获取与对话生成等技术领域的新进展。