学术研究中,专利的归属对研究者而言至关重要,这是对其工作成果的保护与认可。然而,如果因公司变故而使得参与研究的专利被转让,后续的研究将面临怎样的困境呢?深度学习领域的先锋之一、卷积神经网络的创始人Yann LeCun便曾经历过这样的困扰。
提到美国贝尔实验室,科技史爱好者们一定不陌生。这是晶体管、激光器、太阳能电池、发光二极管、数字交换机、通信卫星、电子计算机、C语言、UNIX操作系统、蜂窝通信设备、远程电视传输、仿真语言、有声电影、立体声录音等众多重大发明的源头,拥有成千上万项专利。然而,许多人并不知道,卷积神经网络也在这庞大的专利库中占有一席之地。
近期,约克大学的副教授Kosta DeRpanis揭示了一个鲜为人知的事实。
他发现早在1989年和1990年,AT&T贝尔实验室就申请了两项与卷积神经网络相关的专利,标题为“HiERARCHiCAL CONSTRAINED AUTOMATIC learning NEURAL NETWORK FOR CHARACTER RECOGNITION”,即用于字符识别的分层约束自动学习神经网络。
那么,AT&T贝尔实验室为何如此早便申请卷积神经网络的专利呢?这要追溯到Yann LeCun的早期职业生涯。
在20世纪80年代末,LeCun在贝尔实验室工作。他于1989年发表了关于“利用反向传播进行手写邮政编码识别”的研究,并已成功应用于美国邮政系统。随后,该系统的应用范围扩展到银行支票,到了90年代末,已经处理了美国10%至20%的支票识别。
关于卷积神经网络的专利,LeCun曾表示:
卷积神经网络(ConvNet/CNN)拥有两项专利:一项是具有stRided卷积的ConvNet,另一项是具有独立池化层的ConvNet。这两项分别在1989年和1990年提交,并于1990年和1991年获批。
官方确认:卷积神经网络的专利确实在贝尔实验室于90年前后申请。但LeCun早前提到过一个细节,1996年后,该专利被转移至NCR公司。
这又是为什么呢?让我们继续回顾LeCun的回忆:
我们最初与一个基于ConvNet构建OCR系统的开发团队合作。不久后,AT&T收购了NCR公司,NCR当时正在为银行开发支票成像器和分类机,以便将支票图像发送给人工操作员进行转录。显然,NCR希望实现这一业务的自动化。
最终,我们构建了一个可靠的支票读取系统,该系统在1995年开始商业部署。它能够读取大约一半的支票(无论是机器打印还是手写),而将另一半转交给人工操作员。
实际上,首次部署是在ATM机上进行金额验证(由法国CMB银行率先实施)的前一年。然后在1996年发生了重大变故:AT&T公司拆分成了AT&T(服务)、Lucent(电信设备公司)和NCR。
我们的研究团队留在了AT&T(包括AT&T Labs-Research),而工程团队转至Lucent,产品团队则去了NCR。经过律师的努力,ConvNet的专利最终归NCR所有,因为他们销售的正是基于ConvNet的产品。
因此,我停止了机器学习的研究。当时,神经网络的热度已逐渐降低,我开始与Léon BOTTou一起致力于一个名为DjVu的互联网图像压缩项目,并在20世纪90年代初期撰写了一系列相关论文。
直到2002年我离开AT&T后,才重新开始对ConvNet的研究。我希望NCR没有意识到他们拥有我所做研究的专利。事实上,他们确实没有。在2007年该专利到期时,我为此庆祝。
从这个故事中,我们可以得到启示:当专利与最适合开发它们的人脱离时,专利制度可能会产生反效果。对于有形物品,专利是合理的,但对于软件而言,这几乎从未适用。
尽管明明是自己参与发明的事物,却因公司变故被迫与专利分离,甚至在后续研究中受到限制,LeCun的遭遇或许并非个例。
近两年,谷歌因Dropout等算法申请专利的消息在社区引发了激烈讨论。尽管Jeff Dean后来解释称:“这些算法专利是出于防御目的,主要是为了防止谷歌研究人员的成果被他人申请专利后进行讹诈,从而导致经济损失。”不过,许多人仍对此表示强烈不满,认为“这是一种粗暴且自私的行为,科学和数学的专利阻碍了人类文明的发展。”从LeCun的遭遇来看,反对者的观点似乎是有其依据的。
