我生待明日,万事成蹉跎

纽约时报|技术新波:数据驱动

技术登场,势如波浪。上世纪八十年代的个人电脑、九十年代的互联网、近五年的智能手机,即是明证。

计算机应用的一波新浪潮也许即将来临。许多研究人员及企业家认为,这一浪潮将基于更智能化的机器和软件,把更多的任务自动化,在商业、科学、政务领域协助我们做出更好的决策。其技术上的组成部分,无论是硬件还是软件,日渐就绪,前景乐观。

数据库研究先驱Michael R. Stonebraker就是乐观派之一。企业及政府机构使用的数据库软件(通过甲骨文、IBM、微软及其他公司销售的产品)源自上世纪七十年代Stonebraker与其在加利福尼亚大学伯克利分校同事Eugene Wong、以及IBM公司科研团队的研究成果。

如今,Stonebraker先生看到了新类型超快数据库的商机。他解释说,新软件利用计算机硬件的高速发展,来帮助企业和研究人员从不断增长的大量数据中找到真知灼见,数据来源种类繁多,包括:网页浏览记录、传感数据、基因测试、股票买卖。

因此,68岁的Stonebraker先生成为数据驱动发现(data-driven discovery)领域两家创新公司(VoltDB和Paradigm4)的共同创始人及技术总监。

在麻省理工学院担任计算机科学和人工智能兼职教授的Stonebraker先生说:“时机到了。经济、技术都已成熟”。

对该领域的乐观是有根据的。这些技术的大踏步前进,提出了社会问题,包括对隐私的忧虑,而时机也不太确定。上世纪九十年代所有的大胆预测,即互联网会搅乱传统的行业如媒体、广告、零售等,都成了现实,只不过晚了十年。

然而,科研人员与企业家说,一系列相关的技术已经达到了“临界质量”,或者说到了数字上的沸点,使新产品和性能变为可能。他们指出,技术组件包括在成千台计算机上实现的强大、低成本计算与存储。谷歌及亚马逊公司的数据机房即为典型案例。

另一个快速改善的技术是廉价智能传感器,对新品种的自动设备至为关键,例如处于试验阶段的无人驾驶汽车、无人战斗机等。智能软件,特别是机器学习算法,使这一波的许多智能技术栩栩如生。两个著名例子是:IBM公司在Jeopardy竞猜游戏中获奖的Watson、在线视频网站Netflix的电影推荐系统。

这些基础技术的进步,使人工智能、机器人、数据分析、预测等领域兴奋莫名。康奈尔大学计算机科学家Jon Kleinberg说:“整条技术流水线的各个部分都已同时开动,才有了众多新型应用的大爆炸”。

专家说,大爆炸表象后面是一种技术进化过程。技术预测师Paul Saffo把这一过程与进化生物学中的“间断平衡”概念相比较;该概念出自古生物学家Stephen Jay Gould和Niles Eldredge,认为物种进化经常是周期性涌现的。

然而,他们说,在技术王国,在一次商业突破之前,通常要有多年的进展。

在斯坦福大学工程学院担任咨询教授的Saffo先生说:“即使是在硅谷,大多数技术需要20年才能一鸣惊人”。

互联网为技术进化进步和其爆炸式增长二者提供了一个案例研究。华盛顿大学计算机科学家Edward Lazowska说,1969年,刚诞生的互联网只有四台计算机相连,而今天相连的计算设备(从笔记本电脑到手机)约有10亿部。

早期相连电脑的增加很少有人察觉。Lazowska说:“但是,到了上世纪九十年代晚期,连接台数从4百万到8百万、1,600万、3,200万、6,400万,人们才开始注意到正在发生的革命性变化”。

Rocket Fuel(火箭燃料)是年方四岁的硅谷创新公司,采用人工智能软件在网上为营销商投放显示广告。公司总裁George H. John说,公司不仅能够针对观众群体的年龄、性别、兴趣等来订制广告,还能够采用预测算法根据投放结果产生宣传活动。

例如,一个豪华轿车制造商也许想让公司在下个月份投放一亿份广告,将为每个销售线索向公司支付80美元,凭据是潜在客户下载产品介绍或填写在线表格。

公司快速成长,从今年初迄今员工人数几乎翻倍,目前是240人,本年度已经为500家广告商完成了宣传战役,包括宝马、Duncan Hines、Allstate、必胜客、Ace Hardware等。公司通过风投和借贷筹资7,600万美元,其上千台电脑每日在广告交易所处理190亿笔投标请求。每次广告空间的在线竞拍,一般在约100毫秒(即十分之一秒)内完成。

John先生说,Rocket Fuel公司正在使用他在上世纪九十年代在斯坦福从事人工智能博士研究的某些理念,不出例外,该项研究由国家科学基金会(National Science Foundation)和其他机构的政府资金赞助。近几年来,根据这些理念创业已经是可实现的,也不是那么昂贵了。他说:“很多都取决于基础技术”。

对Stonebraker先生来说,为其创新公司带来商机的硬件进步,在于固态内存的飞速发展:性能攀升、价格直降。固态内存或闪存,通常称为轻型存储技术,用在音乐播放器和智能手机等消费产品中。

然而,固态内存可越来越多地用于大型计算机,把大型数据库装入内存、而无需将数据导出到硬盘上。据Stonebraker先生说,某些数据处理任务完成的速度能够比传统系统快50倍。

他说:“内存是新硬盘。发掘这一技术的潜力,是很自然的”。

在计算的乾坤里,通过软件才能利用硬件、让计算机从事有益的工作。而机器学习程序和其他数据过滤软件的发展,正势如破竹。

康奈尔大学的Kleinberg先生说:“假如算法无法从数据中发现有用的模式或真知灼见,那么,收集和存贮所有这些数据都毫无意义。然而,软件正在根据任务具备规模能力”。

(作者: STEVE LOHR)

2012年9月8日

未经允许不得转载:徐宏涛博客 » 纽约时报|技术新波:数据驱动

分享到:更多 ()

评论 抢沙发

评论前必须登录!