扑克投资家 2018-01-17
36氪独家获悉,香侬科技完成了由红杉中国投资的数千万的民币天使轮融资。此次融资完成后资金将主要用于团队的扩张以及初代产品落地。
信息大爆炸的时代,从海量数据中挖掘有价值的信息格外重要。尤其当这些信息能够影响到二级市场的价格波动时,对投资人与投资机构的吸引力是不言而喻的。目前国内共有三千多家上市公司,仅年报每份报告的字数都在10万字以上。除了年报外,卖方机构的研报、证监会的公告、股票市场的财务信息、社交网络的实时数据监控、专业行业数据库以及各种统计局、法院的数据更是纷繁复杂。
虽然如万得、同花顺、东方财富Choice、彭博等金融信息终端有提供这类数据的工具,但在使用过程中仍有诸多痛点。
比如以文本为主的非结构化数据 —— 上市公司公告、研报等 ,只能实现以PDF原文档为单位做搜索,无法做到跨文档查询、以及自动提取文档中的有效信息;而在处理新闻类别的数据时,无法做到新闻和股价之间的关联性分析以及对新闻本身内容的筛选。
成立于2017年12月的香侬科技希望利用自身所掌握的自然语言处理算法构建一套简单易用的金融搜索分析工具,满足高净值的投资者或投资机构对于数据挖掘整合处理的需求。
香侬科技创始人兼 CEO 李纪为告诉36氪,目前无论是专业的机构投资者还是个人投资者,对数据的需求都没有得到满足。
个人投资者,包括税务机关等政府机构、院校等科研机构、财经媒体等等,其实是典型的长尾客户。他们在工作或者投资中是非常关注上市公司信息的。然而这些长尾客户太过分散,传统的金融信息服务商很难覆盖到。并且对于这部分客户而言,传统的数据终端使用起来不够便利。这些痛点却是人工智能算法的强项,目前的AI技术可以提供非常好的用户体验,覆盖这部分长尾客户的需求。
就专业的机构投资者而言,即便能够熟练地使用数据终端,但其在日常的投资研究中面临诸多问题仍是目前的工具无法解决的。比如一个专业的分析师,要从零开始研究一个行业或者公司,要做的事情包括阅读行业报告、公司的招股书和公告、研究管理层背景、政府政策、专家访谈等等。比如,如果分析师想回答“历史上柴油车油品升级对于行业各公司的股价及财务影响的分解”、”定增从证监会受理到最终拿到批文一般多久”或者“某药品过去5年在所有省份的中标价变化”,需要大量阅读多如牛毛的信息。
这些环节中,数据终端能提供的帮助其实是有限的,但AI技术其实可以很好地解决上述一大部分问题,帮助分析师节省时间和精力。甚至通过分析师与产品的不断互动,产品会不断学习分析师的投研逻辑,帮助分析师建立模型,一直到完成一篇深度研究报告。AI完全可以成为分析师在研究中不可或缺的帮手。
最近几年深度学习的技术发展为自然语言理解、信息抽取等诸多方向带来了翻天覆地的变化,也给很多行业垂直领域带来了新的可能性。李纪为认为运用这些深度学习技术,深耕于金融领域,将会带来更深更广的变革。香侬科技的解决方案是通过深度学习算法对非结构化的海量数据进行整合、抽取、结构化,再通过自然语言实现人与数据的交互,更便捷、直接、准确、全面地为用户提供想要的信息及资讯。
举例说明,假如分析师或投资人想了解“上季度基金减持最多的交通运输公司”只要在香侬科技系统内按照正常的语言逻辑将问题输入系统,便可得到如下数据:
再比如,如果想问“去年煤炭行业上市公司产量和销量对比”,在对话框中用自然语言输入问题的表示,系统便会自动给出可视化答案。
李纪为同时也提到,完成这项浩大的工程绝非易事。首先,需要对金融领域知识信息、以及背后的商业逻辑有着深入的了解,洞察投资者的需求和痛点。更重要的是,需要互联网跟金融两个行业更紧密的结合与交流。这种结合不仅仅局限在对对方业务需求的认知和算法的理解,更是来自两个行业的不同工作方式、思考方式甚至文化的融合。李纪为表示,建立一个兼容、多元的企业文化将会是一个漫长的过程。但同时,他认为这将是香侬科技的一个巨大的优势。
李纪为表示现在系统仍处于内测阶段,具体的商业模式仍在探索当中,虽然现在有初步的构想,但也很可能根据市场的反馈去做调整。此外,团队也正在招募相应人员,需要自然语言处理和深度学习方面的人才, 以及希望招募更多前后端、产品经理、UI设计等多方面的人才,共同努力把产品落地, 去改变现有的金融领域。
香侬科技创始人兼 CEO 李纪为博士毕业于斯坦福大学人工智能专业,研究方向是深度学习在自然语言处理的应用。他是斯坦福计算机专业第一个三年毕业的博士研究生。在最近3年时间内,以第一作者发表的AI领域顶级会议文章数量高居全球第一,也是NLP领域世界范围内引用次数最高的博士生之一。博士期间曾在Facebook 人工智能实验室 (FAIR) 和 微软总部研究院 (MSR) 进行科研工作。
联合创始人沈盛杰2011年本科毕业于北京大学物理学院,2013年硕士毕业于北大光华,曾在对冲基金Magnetar Capital和中信证券等公司工作,主要负责金融数据处理,衍生品定价和交易策略研究等工作;另一位创始人何豪杰是国内二级市场资深研究员,长期从事行业和上市公司研究,了解市场上各类投资者的投研需求,曾就职于招商基金和著名私募基金星石投资等公司。
采访的最后,李纪为表示自然语言处理、信息整合、深度学习其实是算法与用户不断融合的过程。在这个信息爆炸时代的大背景下,技术和用户都在不断地迭代进化。在金融领域,随着AI技术的不断深入,会有新的需求逐渐涌现,也必将产生出一个全新的人与信息的交互模式。