由芯片公司打造的更加智能化的摄像头正在催生新一代设备,这些设备不仅能捕捉图像,还能分析图像,并根据分析结果采取相应的行动。

  计算机视觉技术所取得的这些发展既可以让监控摄像头网络去追踪一个包裹,也能让像苹果公司(Apple Inc., AAPL)新发布的iPhone X那样通过识别人脸解锁智能手机。

  Alphabet Inc. (GOOG)旗下的Nest Labs在9月份发布了一款配备高通公司(Qualcomm Inc., QCOM)芯片、摄像头和脸部识别软件的门铃,如果门铃“看到”一张熟悉的面孔,就会向Nest的手机应用程序发送警告。

  根据国际数据公司(International Data Corporation, 简称IDC)的数据,计算机视觉系统市场目前方兴未艾,到2021年市场规模有望从去年的10亿美元左右扩大至26亿美元。自动驾驶汽车和个人机器人等新产品的出现预示着计算机视觉系统市场将持续增长,英特尔公司(Intel Co., INTC)、高通和其他芯片生产商正在争相为新设备提供“大脑”。

  IDC分析人士Michael Palma说,这些应用正渐渐走向成熟,也许还不到火候,但也所差不远。

  上个月被迪尔公司(Deere & Co., DE)以3.05亿美元收购的硅谷初创公司Blue River Technology正在利用英伟达(Nvidia Corp., NVDA)技术支持的计算机视觉系统来帮助莴苣种植者提高生产力,降低或重新分配劳动力成本。

  种植者通常的做法是密集撒播莴苣种子,然后用锄头给生长过密的莴苣幼苗间苗,这是一项非常耗时的工作。

  相比之下,Blue River的“See & Spray”系统(安装在拖拉机后面的一个作业平台)配备了最多24个摄像头,每个摄像头都安装了英伟达的Jetson计算机,可以识别单株莴苣并评估其与邻株的间距,精确度可达四分之一英寸。一旦发现间距过近的植株,高精度喷枪就会自动喷出肥料将其浸没,喷射的肥量不但能杀死这株莴苣,还能让土地得到滋养,所有这些工作都不需要人来干预。

  Blue River的“See & Spray”系统(安装在拖拉机后面的一个作业平台)配备了最多24个摄像头,每个摄像头都安装了英伟达的Jetson计算机,可以识别单株莴苣并评估其与邻株的间距。 图片来源:BLUE RIVER TECHNOLOGY

  加州大学戴维斯分校(University of California, Davis)蔬菜种植专家Richard Smith说,See & Spray系统通常能在12分钟内完成一英亩土地的间苗工作,而一个人要完成这项工作需要八个小时。Blue River表示,这款设备能将作物产量提高10%。迪尔计划将这项技术应用于其他作物,这也是该公司将农业从农田照管向培育单株作物方向转变的一部分。

  Blue River负责新技术开发的Willy Pell认为,推动硅谷下一轮投资的将是那些能够感知世界并在无人干预的情况下根据感知采取行动的设备。

  Pell表示,靠眼手配合做事是人类的一项重要本领,而配备了摄像头眼睛和芯片大脑的机器不久就能接手所有这种重复性的工作。

  这项技术也给消费级产品带来新的功能。高通下一代骁龙(Snapdragon)智能手机芯片能把摄像头捕捉到的图像转化为详细的三维地图,这对于增强现实应用中将计算机生成的图像叠加在现实场景中的技术非常有用。

  英特尔子公司Movidius研发的Myriad系列芯片能以极低的耗电量进行人工智能运算,这种芯片目前已在监控摄像头和无人机领域找到市场,并且正在向医药领域推进。

  初创公司Doctor Hazel利用一款Myriad芯片研发了一款人工智能设备,可以和医用摄像头配合现场检测皮肤癌。该公司联合创始人Mike Borozdin说,这款设备的癌症诊断准确率最高可达85%,而且随着良恶性痣影像的不断输入和训练,诊断准确率应该会进一步提高。

  这些新的计算机视觉系统都有足够强大的计算能力,无需远程服务器即可实现本地化AI图像处理,这是一个优势,能提升处理速度,使设备在不具备稳定的网络环境的情况下也能照常工作(例如一架检查风电场涡轮机的无人机),同时也避免了私密或专利信息遭泄露的风险。

  英伟达负责机器人和无人机等AI应用的副总裁Deepu Talla认为,无论是本地还是远程处理都是必要的。

  例如,安装在城市交通信号灯上的摄像头可以计算过往车辆的数量,并将结果发送至一个云计算数据中心,由这些数据中心对结果进行分析,进而控制信号灯保持交通顺畅。英伟达正在杭州与阿里巴巴(Alibaba Group Holding Ltd., BABA)合作研发一个类似的系统,同时还在深圳与华为(Huawei Technologies Co.)进行类似的合作。

  Talla说,仅靠人眼是无法处理摄像头捕捉的所有图像的,人们需要计算机视觉的帮助。