SHEROM 2019-04-10
数据分析挖掘与工业大数据是智能制造与工业互联网的核心,其本质是通过促进数据的自动流动与智能决策去解决控制和业务问题,有效减少决策过程所带来的不确定性,并尽量克服人工决策的缺点,从而推动智能制造进程与智能工厂的建设,帮助制造企业保持竞争力。但是对于一般用户来说,可能并不是很了数据分析在制造行业所能带来的收益和影响。
近日,博世中国投资大数据分析师 王红星接受了AI科技大本营的专访。采访中他从产业和技术的角度分享了大数据和AI在制造业的应用,以及面临的问题。
王红星,本科就读于数学与应用数学专业,研究生继续攻读概率论与数理统计专业,曾任希捷科技(Seagate Technology)数据分析职位,后加入迈科网路(Mexnet)协助筹建数据研究院,现任博世(中国)投资大数据分析师,负责大数据和数据分析相关业务,为博世集团各个事业部和制造工厂完成数字化和数据驱动转型。王红星表示,大数据和AI的在制造业中已不仅仅局限于宏观上的设计和规划,更有诸多的实际应用案例落地,已经在切实帮助制造业企业节省成本,提高产能,提升行业竞争力。这些应用领域可以覆盖设备的预测性维修、产品的质量保证、产能优化与排程、产量提升、参数优化等各个方面。
比方说在预测性维修领域,通常的做法是每个固定的时间之后做机器的检修工作。由于机器本身的复杂性等因素,通常设备工程师并不知道设备的哪个环节或零件会有问题,缺乏针对性;并且,设备的磨损和消耗只有累积到一定程度才能都显现出来,并被检查到。而生产过程中的突然停机事故会影响产能,有时也会影响产品的质量。
虽然从本质上讲,大数据和AI的加持可以帮助制造业完成数字化的转型,但是在实践中,还是存在不少问题和难点,比如数据质量问题。在他看来,工业大数据中,数据质量一直是许多工厂和企业面临的挑战。这些数据源通常包括传感器、数据的软硬件采集模块、通讯协议、各个生产制造系统以及各类辅助系统。所以,企业必须在数据质量的管理上下功夫,特别是在制造业领域,不能仅仅追求数据的量大,更应注重数据的全面性,在特定的应用场景下,还应该关注数据的准确性与实时性。
从企业角度看,大数据和AI在制造业的应用可以帮助企业进行智能化改造和升级,但是从国家角度看,制造业升级是推动中国产业变革的催化剂,而大数据和AI则是制造业升级的新动力。从国家战略层面看,美国的工业互联网、“德国工业4.0”、“中国制造2025”本质都是实现传统制造业的转型升级,实现数字化、智能化,更加符合多元化以及柔性生产的要求,从而在新的历史条件下的激烈竞争中立于不败之地。
王红星认为当前中国的制造业企业智能化和数字化程度参差不齐,不同细分行业的自动程度也大相径庭,比方说,电子制造业的自动化程度一般会比机械制造类的自动化水平要高。但是,所有的制造业企业都应该关注自身特点,积极拥抱数字驱动变革,针对数据采集、治理、平台等重点方面的科技趋势,对于相对成熟和明确的解决方案进行战略性投资,以保持企业持续的竞争力。
产业的一端是企业,另一端是无数奋斗在一线的广大开发者,对于开发者来说,他们更关注的是技术的方向和趋势。他们更想了解的是Python在大数据和AI领域扮演着怎样的角色?未来有怎样的发展空间?
对于这个问题,王红星表示,目前已经有很多工具辅助大数据分析和人工智能,但毫无疑问,Python是最受欢迎的。首先Python易学易用,这个语言有着直观的语法并且还是个强大的多用途语言,也因此经常被称为”胶水”语言。在机器学习,大数据,人工智能领域已经有了成熟的软件包和生态,涵盖了数据采集、清洗、模型、部署的方方面面。在可以预见的未来,python仍然是大数据与人工智能领域的主要语言,套用一句流行语“人生苦短,我用Python”。
如何更高效地学习Python,并学以致用,解决实际问题?王红星认为,答案是要“用”。Python的语法直观,简单易上手,关键是使用Python去解决现实中遇到的问题。如果没有现实的问题,最好也可以做到学以致“练”。当然,刚熟悉完Python的语法,有时直接上手应用会有点摸不到头绪,甚至语法部分有些也晦涩乏味。
4月13日-14日,中国IT技术社区CSDN将重磅启动「2019 Python开发者日」。本次活动,我们将邀请王红星带来《数据分析及大数据在制造业的应用》的精彩分享,涵盖数据分析和大数据技术的基本概念、方法及工具,并介绍大数据分析技术在制造领域的典型应用案例,主要包括:
(1) 数据分析的基本概念、工具及技术
(2) 工业大数据的范畴、典型特征及发展现状
(3) 应用场景和应用热点
(4) 典型应用案例,包括自动诊断、预测性维修、全自动生产线等
(5) 数据分析项目的实施
演讲之外,王红星还将利用4个小时的集中训练,带来Python在数据分析和大数据应用方面的实战,带大家重新认识Python与数据。
培训大纲如下:
数据的分析与挖掘能力已成为企业保持竞争力的必要条件,Python无疑在数据分析挖掘中扮演着无可替代的角色,也是数据科学家的首选工具之一。这里将会介绍数据分析的基本过程,并如何使用Python完成数据的抽取、转换、特征提取、建模预测所需的技术与原理,实际操练具体的案例,目标是能够使参训人员了解数据分析,能够完成基本的数据分析任务。另外,随着大数据的兴起,Python在大数据领域扮演了至关重要的角色,本培训还将介绍Python在Hadoop生态中的应用,特别是利用Spark进行基本的数据挖掘任务。
(1) 简单介绍数据分析的基本概念
(2) 数据挖掘的基本过程
(3) 数据挖掘的主要手段
(4) 数据探索、数据预处理、与挖掘建模
(5) 案例与演练
(6) 大数据的基本概念
(7) Hadoop基本介绍
(8) Spark与Pyspark基本介绍
(9) 大数据案例
适合人群:适合对数据挖掘和大数据有兴趣的学生和初级技术人员
难易程度:中等
需要提前掌握的知识点:Python基本语法,数据分析基本概念等。
提前需要安装的环境:提前装好Anaconda Python3, VM VirtualBox
现场硬件的要求:建议至少8GB ROM + 4Core CPU
除此之外,我们还将邀请来自阿里、IBM、英伟达、平安科技、爱奇艺等一线公司的十余位Python技术专家,重点围绕Web开发、数据分析、人工智能等技术模块,分享真实生产环境中使用Python应对IT挑战的真知灼见。
此外,针对不同层次的开发者,大会还安排了深度培训实操环节,为开发者们带来更多深度实战的机会。欢迎开发者们到现场参与讨论!