特斯拉收购初创公司 专注自动驾驶“深度神经网络”
2019年年底,有消息称特斯拉收购了位于旧金山湾区的初创公司DeepScale,该公司专注于开发自动驾驶汽车的“深度神经网络”,收购金额未披露。DeepScale专注于计算节能的深度学习系统,这也是特斯拉关注的重点领域,特斯拉决定设计自己的电脑芯片来驱动自动驾驶软件。有猜测称,特斯拉收购这个团队是为了加速其机器学习的发展。
现在,特斯拉公布了名为“用扩充数据训练机器模型的系统和方法”的新专利,我们也看到了这笔收购带来的成果。这项专利的发明者包括DeepScale的三名成员,分别是马修.库珀(Matthew Cooper)、帕拉斯.贾因(Paras Jain)和哈西姆兰.辛格.西杜(Harsimran Singh Sidhu)。
目前在特斯拉旗下工作的DeepScale团队正在尝试申请的这个系统,它与利用几个不同传感器观测场景的数据来训练神经网络有关,比如特斯拉司机辅助驾驶系统Autopilot传感器阵列中的八个摄像头。
特斯拉在专利申请中描述了这种情况的困难:“在典型的机器学习应用中,数据可以通过多种方式进行扩充,以避免过度拟合用于获取训练数据的捕获设备的特征模型。例如,在用于训练计算机模型的典型图像集中,图像可能代表许多不同捕获环境的对象,这些环境具有与被捕获对象相关的不同传感器特征。例如,这样的图像可以通过不同的传感器特性来捕获,就像不同的尺度、焦距、镜头类型、预处理或后处理、软件环境以及传感器阵列硬件等等。这些传感器在不同的外部参数方面也可能有所不同,例如成像传感器的位置和方向相对于捕获图像时的环境。所有这些不同类型的传感器特性都会导致所捕获的图像在图像集中呈现不同的形式,使正确地训练计算机模型变得更加困难。”
对此,特斯拉团队总结了他们应对这个问题的解决方案:
第一个部分是用于训练预测计算机模型一组参数的方法。该实施例可以包括:1)识别由一组摄像头捕获的图像,该图像被附加到一个或多个图像收集系统中;2)对于图像集合中的每一幅图像,识别该图像的训练输出;3)对于该组图像中的一幅或多幅图像,通过以下特定步骤生成增强图像:通过用维护图像的摄像头属性的图像操纵功能修改图像来为该组图像生成增强图像,并将该增强训练图像与该图像的训练输出相关联;4)训练预测计算机模型的该组参数以基于包括该图像和该组增强图像的图像训练集来预测训练输出。
第二部分包括具有一个或多个处理器和存储指令的非暂时性计算机存储介质系统,该指令在由一个或多个处理器执行时,会使处理器执行相关操作,这些操作包括:1)识别由一组摄像头捕获的、同时附着到一个或多个图像采集系统的图像集合;2)对于所述图像集合中的每幅图像,识别图像的训练输出;3)对于该组图像中的一幅或多幅图像,通过以下步骤为一组图像生成增强图像:通过用维护图像的摄像头属性的图像处理函数修改图像来为该组图像生成增强图像,并将该增强训练图像与该图像的训练输出相关联;4)训练预测计算机模型的参数集来预测基于图像训练集的训练输出,包括图像和增强图像集。
第三部分以包括具有供处理器执行指令的非暂时性计算机可读介质,该指令在由处理器执行时使得处理器能够:1)识别由一组摄像头捕获的、同时附着到一个或多个图像采集系统的一组图像;2)对于该组图像中的每幅图像,识别该图像的训练输出;3)对于该组图像中的一幅或多幅图像,通过以下步骤为一组图像生成增强图像:通过用维持图像的摄像头属性的图像操作功能修改图像来为一组图像生成增强图像,并将增强的训练图像与图像的训练输出相关联;4)训练计算机模型以学习基于包括图像和该组增强图像的图像训练集来预测训练输出。
正如之前报道的那样,特斯拉正在经历“对特斯拉Autopilot的重大基础性重写”。作为重写的一部分,首席执行官埃隆.马斯克(Elon Musk)表示:“神经网络正在吸收越来越多的问题。”
新专利中还将包括一个标签系统,马斯克称3D标签将改变游戏规则:汽车进入有八个摄像头的场景,画一条路,然后你可以用3D标记那条路。这种用多个摄像头训练机器学习系统的新方法,就像特斯拉的Autopilot一样,带有附加数据,可以成为Autopilot更新的一部分。