【财新网】(专栏作家 张小彦)数据科学的核心是决策支持。决策支持有两个层次。第一层是知情决策,即通过数据处理和分析产生信息使决策者在知情状态下决策。第二层是智能决策,即通过数据处理和分析产生数据模型、人工智能以至能对不同应对方案的结果进行预测和评估。目前在社会管理和政府决策领域,大部分数据科学的应用,不管是用大数据(网络、社交、电子监控等无结构数据)还是小数据(行政、管理、抽样调查等有结构数据),都属于知情决策。智能决策的难度比知情决策要大的多。即使在大数据和数据科学的发源地美国,政府管理方面智能决策的成功案例也是凤毛麟角。
智能决策成功的案例大多出现在随互联网而生并发展壮大的行业。这类行业的巨头谷歌、亚马逊、脸谱、阿里巴巴、腾讯、百度等在应用数据科学和大数据技术支持智能决策方面都有傲人的业绩。仔细分析一下就可看到它们的成功有一个共同点;人工智能加实时数据验证。
它们之所以能做到这一点,除了有足够的资金用于数据技术的软硬件投资和聚集最优秀的数据人才,还有一个得天独厚的资源:源源不断自然积累的实时数据。海量数据对人工智能和机器学习算法的实时反馈和修正造就了完整有效的智能决策系统。可以说,人工智能+实时验证=智能决策。
人工智能和机器学习必须有真实客观数据反馈的不断检测和修正才能不断地改进和提高。而这种反馈的周期越短,频率越高,智能决策系统的优化过程就越快,决策质量就越高。
知情决策和智能决策都要以数据为基础。但两者的数据分析属不同层次。描述性分析(descriptive analysis)和探索性分析(exploratory analysis)是支持知情决策的主要方法。数据可视化是知情决策的有效手段。预测性分析(predictive analysis)和仿真模拟(simulation)是智能决策的主要方法。人工智能和机器学习是其重要的手段。
美国在社会管理和公共卫生方面应用数据科学和大数据技术比中国起步早,在人工智能方面的科研也已经取得了很多成果。但由于美国是联邦制国家,各级政府之间分权制衡,实现人工智能与实时(或接近实时)数据对接以达到智能决策优化的过程步履艰难。反观中国,由于中央集权和拥有一整套自上而下的严密组织,后发之中可能有新机遇。比如今年初笔者在中国疾控中心交流时现场观看了该中心通过云平台连通全国7万多家上至3甲医院下到乡镇诊所对39种传染病案例实时监控上报信息系统。这在美国是很难做到的。如果能将这种中央控制的实施监控数据与人工智能产生的传染病仿真模拟预测对接,中国不但可以借鉴美国已开发出来的人工智能技术,而且能先于美国在传染病防控方面形成有效的智能决策系统。这正是一种弯道超车。
作者为社会学博士,现任美国匹茨堡大学客座教授并兼任一家软件公司董事长和数据科学家





