阿里给所有卖家发福利:全球首个人工智能中文字库免费用

82437702 2018-02-23

阿里给所有卖家发福利:全球首个人工智能中文字库免费用

文/ 天下网商记者 孙茜茜 王安忆

编辑/ 翁菲

你打开手机淘宝,精美的海报让你目不转睛,你下了单,从快递员手中接过商品,心满意足的那一刻,你不会想到自己在掏钱买下商品的同时也为海报买了单,从模特、摄影到设计师的后期处理,越精美的海报成本越高,当然,你更想不到的是,海报上的每一个字都是要花钱的……

最近,阿里巴巴悄悄推出了全球首个人工智能中文字库,这款阿里汉仪智能黑体测试版,目前拥有3500个中文汉字,将免费提供给阿里用户使用。

阿里给所有卖家发福利:全球首个人工智能中文字库免费用

服务市场下载页

这既是阿里给电商卖家的春节福利,也是一种新的尝试,阿里希望用技术手段,降低造字成本,让字体市场进入良性发展。而这项技术的受惠者,除了商家、字体公司,当然还包括了消费者。

一套版权费20万的字体

一套正版字体价值不菲。

据悉,天猫上某商家就为一套方正兰亭字体支付了20万元左右的版权费,虽然14款不同字体可以使用5年,但对商家来讲,“要价还是偏高”。

万一有适合广告宣传的收费字体,但前期没有购买版权怎么办?

让设计师对已有的字体进行修改加工,变成新的字体,是一种解决办法。然而一位设计师曾花了半天时间,只设计出6个中文汉字。

“修改设计每个单字不难,把控字体的统一性才是最难的。”该设计师表示,例如“品”“门”“口”这样的字结构过于单一,在修改时反而会增加难度。“有时会发现,组合成的一句话中出现了两种字体,甚至6个字的标题中会出现6种字体,很头疼。”

出于成本考虑,一些商家并不愿意在购买字体版权上花钱,只使用阿里平台上免费商用的华康字体和开源字体。

还有部分商家,则选择使用未经授权的字体,踩中了涉嫌“字体侵权”的雷区。一旦被字体公司起诉,商家除了赔钱,还要撤回已经发布的字体内容,企业的品牌形象和销售业绩都会受到影响。

为什么造字成本这么高

一套字体为何要价万元,字体公司为何四处维权打官司?侵权与维权的背后,不仅仅是利益的撕扯,还有关于创意价值的认可度。

用传统的方法创造一套字体,其实成本很高,因为需要经过创意、选字、确定、拼字、自动分装等一系列漫长的流程。

阿里给所有卖家发福利:全球首个人工智能中文字库免费用

一套字体通常有两个特点:字型和字量。字型是设计师对字体的“创意”,字库字体讲究整体的搭配协调和美感。

而每套字体的字量通常由市场需求决定。常用的中文简体有6763个中文汉字,包含中文简繁的9169个,用于出版物的大字符集(包含很多生僻字)27533个,包含稀有地名人名用字的超大字符集包含中文7万字以上。

传统字体公司的设计师,可以设计出很独特的单个中文字体,但即便是难度相对低的字型,他们也很难独立完成整套设计。通常是,主创意者创作五六百个字,确定字体的基调后,再由团队其他成员完成剩下的工作。

每一个字都要经过设计师一笔一画地仔细勾勒、调整。通常,设计一套风格字库需要设计1万个左右的字符和标点符号,少则半年、多则好几年才能进入市场。而且,设计出的字体还可能因为不受用户欢迎而宣告失败。

设计成本居高不下,导致正版字体价值不菲,而正版支持者越少,造字成本越高,价格更加降不下来,造字市场就会陷入恶性循环。

怎么用人工智能造字

阿里巴巴每年也要向字体公司支付金额可观的版权费用,就像阿里人机自然交互实验室经常与字体打交道,因为他们的一个研究方向就是设计智能。

“字体相当于设计领域的水电煤。”实验室负责人杨昌源说,“有的字体真的很好看,我们真的很想用,但是太贵了。”

正版字体这么贵,有没有可能让造字成本变低?杨昌源决定带领团队在字体领域做一个新的尝试,用AI生成字体。

“阿里有人才有技术有资源来做这件事情。”杨昌源觉得,造出一款免费字体,对阿里来讲很有价值,既能让商家不再担心版权问题,也能让字体市场变得更加健康。

彼时,实验室正好与阿里PAI团队在其他业务上有所交集,后者主要负责基于阿里云分布式计算引擎的一款机器学习算法平台,“能不能提供技术支持我们做些事?”杨昌源向对方发出了合作邀请。

实验室想要引入新的技术改变现状,PAI团队想要试验新的技术,双方一拍即合,很快达成跨团队合作的意向,他们打算让机器做出一套“跟人做的一模一样的”精美的字体。

此次AI造字,PAI团队的人工智能专家张庆、孙东慧针对字体生成的特定场景将对抗生成网络(GAN)进行了改进。

团队先用天猫字体和淘字体做尝试,但由于两类字体的样本量太少,在手动补充字体样本,用了一两百组算法模型后,设计团队仍认为,字体的精准度不够,还是半成品。

“因为做精准设计的设计师拥有像素级的眼睛,左偏了一个像素都不舒服。” 杨昌源解释道。

两个团队在标准上不能达成一致,AI造字陷入瓶颈。

造一套自带流量的字

调整方向还是就此放弃?杨昌源决定,引入专业的字体公司一起来制定标准。

找字体公司合作并非一帆风顺。“起初谈的时候蛮难的,字体公司的危机感比我们强很多。”杨昌源表示。

很多人惧怕人工智能技术。最初,字体公司担心,自己的生意甚至是整个字体行业会“没了”,更担心阿里这个巨头会不会进入字体这个商业航道。

“字体并不在阿里的主航道上,我们没有野心深度介入字体行业。”杨昌源反复向对方解释,用人工智能造字,是想要尝试将新技术运用到传统的字体领域,“我们不会跟传统行业直接去竞争,我们更多是给大家一个示范,毕竟专业领域的事情还是要靠专业的人去做。”

在合同上来来回回讨论了个把月后,去年12月,汉仪终于与阿里签订了合同,决定双方联手做一套有AI技术成分的字体。双方决定合作的字体是汉仪公司的明星产品,AI造的字体相当于是给这个系列产品做了延伸。

杨昌源说,“签下合同后,我们定下目标:农历年前,一定要出一个版本给大家看,看能到什么程度。”

这次合作中,汉仪字库的设计师负责字体的造型设计,阿里的技术团队负责技术,最终通过“喂养”机器,让其自学并生成了一套字库。

阿里给所有卖家发福利:全球首个人工智能中文字库免费用

阿里汉仪智能黑体字形设计

在大数据的帮助下,汉仪字库设计部负责人郑乃玉了解到,一套字体设计出约3500字就能覆盖常用的电商广告用语。

让字体设计师们纠结的是,什么样的字体能帮助电商提升销量。他们希望造出一套“自带流量”的字体,郑乃玉说,“例如,商品广告中‘降价了’这样突出的语言最适合使用现在的字体。”

“不能以人为标准去评判AI字体的好坏。”杨昌源表示,评价字体好坏的标准是,生成的字体跟样本字体有90%以上的神似即可,“至少看上去,它像一套字体。”

2018年1月22日,阿里巴巴终于推出了全球首个人工智能中文字库——阿里汉仪智能黑体,并免费提供给阿里用户使用。

正式版将于4月推出

在这套智能字库测试版本发布当天,景德镇胡图网络科技公司的设计师们在第一时间就下载使用了,设计部的胡经理解释,他们的设计师主要做电商设计的排版,自己根本没有时间设计字体,“现在又有新的选择,还是AI生成的,当然要马上试用一下。”

试用后,胡经理也发现了测试版的一些问题,例如螺蛳粉中的“蛳”、聚会中的“聚”字在被放大后会显得棱角不明,像是没有切割完整。另外,阿里这套字体只适用于醒目的大标题,8号、12号大小的字体就不够清晰且略显粗糙。

阿里给所有卖家发福利:全球首个人工智能中文字库免费用

胡经理发现测试版中字体的一些问题

汉仪字库设计部负责人郑乃玉表示,AI只能生成字体,并不会自己做调整,人机协作是目前的最佳手段,“横平竖直、棱角分明的汉字还是要靠人工干预。”

杨昌源也坦言,测试版本不完美,还在继续优化。2018年4月,“阿里汉仪智能黑体”将推出正式版本,最终字符集可能是6763,未来将用于服务阿里新零售下千万商家及阿里设计生态。

阿里给所有卖家发福利:全球首个人工智能中文字库免费用

字体机器生成过程

人工智能改变字体行业

电商卖家成千上万,消费者喜欢的风格也五花八门,胡经理就发现,女性用户更喜欢秀气的字体,但这套人工智能字库的字体略显粗犷。

对此,杨昌源表示,“阿里在字体领域做尝试是想告诉大家,字体领域是可以有这样一个成果的,进而鼓励大家在有奔头的情况下去做一些尝试。”

“我们想解决的是,当创意很好的时候,怎么加速创意产生到生成的过程。以前设计一套字体需要投入10个人做一年,现在引进新技术,能够节省4-8个月的时间,可以让字体设计人员把注意力更多的放在创意上。” 杨昌源表示。

按照杨昌源的想象,未来,字体行业可能是另一个景象。“字体生态丰富起来,字体的版权也许就不会那么贵了。”

AI造字的过程中,也产生了副产品。“字体检测,我们能够做的很精准了。” 杨昌源透露,现在他们可以检测某字体可能盗用了哪几款正版字体,并提供相应的概率。

在造“阿里汉仪智能黑体”的同时,团队从市面上收集来雍正的毛笔字,临摹出来后给机器学习,机器通过自学仿造出了雍正字体。这项技术无疑将给字体行业、文物及博物馆修复带来一些新的尝试和可能性。

阿里给所有卖家发福利:全球首个人工智能中文字库免费用

机器学习的雍正字体

杨昌源开玩笑说,“以后过年,可以让‘雍正赐字’,给电商卖家做些好彩头。”

相关推荐