语音识别大牛Dan Povey因学生闹剧被约翰·霍普金斯大学解雇-电子发烧友网

语音识别大牛Dan Povey因学生闹剧被约翰·霍普金斯大学解雇，怒拒Facebook“不公平调查”，或投身中国企业并在中国大学兼职。这是近期发生在饱受西方“价值观”争议的Dan教授身上发生的一连串事件，事实说法不一，真相扑朔迷离，但国内学界业界一齐欢迎Dan。

语音界大佬、开源语音识别系统 kaldi 的开发者 Dan Povey 被约翰・霍普金斯大学 (JHU) 解雇了。

Dan Povey

Facebook 马上向 Dan Povey 伸出橄榄枝，Dan 接受了。

但 Facebook 表示暂时只能给 Dan 6 个月的 “合同工” 合约，直到完成对所发生的事情的调查，并将根据调查结果决定是否正式聘请。

Dan 拒绝了，并讽刺 Facebook 的所作所为让他感觉 “déjà vu（似曾相识）”。

Dan 最新在个人主页上的汇报是，他计划去一家中国公司工作，并且 “或许会在一所中国大学兼职”。消息一出，国内学界业界颇为兴奋，纷纷猜测大神将去哪儿。

来源: 微博是什么让语音界大佬愤而出走，他在约翰・霍普金斯大学发生了什么？这一切，始于 Dan Povey 一次 “为了夺回服务器” 的反抗，以及因此发生的一场闹剧式的解雇风波。

教授深夜闯入，只为夺回服务器事情发生在 5 月 7 日的午夜，Dan Povey 带着一把断线钳，试图趁着夜黑风高闯入被抗议的学生占领的行政楼，夺回 CLSP（语言语音处理中心）维护的服务器的控制权。

在这之前，行政楼 Garland Hall 已经被静坐抗议的学生占领长达 34 天，他们将窗户封紧，大门用铁链锁上。

被学生占领的Garland Hall外墙

学生们一是抗议学校设立 Private Police，校方称是为了加强校园安全，而学生们认为这会加剧种族矛盾；学生抗议的第二点是校方与美国移民及海关执法局 (ICE) 签署的培训合约，校方表示，这主要是与医学院签署的紧急医疗培训和领导力教育合同。校长称，他不会终止这些合同，而且这些合同很快就要到期了。

在双方的激烈对峙下，学生们用铁链封锁了 Garland Hall 的大门，以静坐的方式进行抗议。据称，学校曾同意和抗议学生坐下来开会谈，只是因为通知时间只有 12 个小时，学生们拒绝了会谈。

大楼内部

但 Dan 负责维护的 CLSP 的服务器在大楼里，在试图向学校申请进入大楼维护服务器无果之后，他决定阻止这场抗议。

Dan 以工作狂闻名，他的学生 Guoguo Chen 在知乎上说：“这么些年和 Dan 接触下来，感觉有两个点是不能触碰的，一个是时间，一个是服务器。”

Guoguo Chen 说：“Dan 还有一个不能接受的便是服务器的不稳定。Dan 在很多事情上都比较宽容，但是如果谁乱用了服务器的资源，会收到 Dan 非常严厉的警告。Dan 觉得数据和计算资源，对整个 CLSP 来说，都是非常非常重要的资产，需要随时保证 CLSP 的每一个人都可以使用到。我相信这也是为什么 Dan 在这次事件中，会试图夺回服务器，避免数据和及其资源的损失。”

根据当地报纸的报道，那天夜里，在其他六名 “社会闲散人士” 的陪同下，Dan 携带钳子前往大楼，费力地试图剪断抗议学生在门上绑的铁链，夺回服务器的控制权。

视频拍摄到Dan被学生们推出大楼但他失败了。随即引发了肢体冲突，Dan 被学生们推挤出大楼，而与他同行的另一名男子被指殴打了抗议学生一拳。Dan 说，学生们把他带出大楼时刮伤了他，背上一道大划痕；学生们也向他带去的人挥了很多拳，而他们表现出令人钦佩的克制，虽然有一人回敬了一拳。

据称，闯入大楼前几小时，他带着写着 “不要让我跟你妈妈告状、让工作恢复正常运行吧” 的看板前往现场。

Dan 在他的网站上解释，强行进入大楼是因为研究用的服务器故障，而该服务器在学生占领的大楼内。

在 Dan 试图进入被占领的大楼数小时后，5 月 8 日早晨，将近 100 名巴尔的摩警察包围了大楼，警察清理了大楼并逮捕了七名抗议者，但该市的最高检察官后来放弃了对他们的所有指控。

Dan遭解雇：我依旧保有尊严和独立的思想

Dan Povey 是语音界赫赫有名的大佬，根据 LinkedIn 的信息，自 2012 年以来，他一直在约翰・霍普金斯大学担任助理研究教授。在加入霍普金斯大学之前，他曾在微软和 IBM 担任研究员。

“夺回服务器” 事件后，Dan Povey 先是被停职，随后在 8 月 8 日，被校方以 “危害学生安全” 为由解雇。

“作为约翰・霍普金斯大学的一名教员，你制造了一个危险的局面，最终可能对我们的学生、你自己和社区里的其他人造成严重伤害，”Dan 公开了这封解雇信，解雇将于 8 月 31 日生效。

该学院副院长 Andrew S. Douglas 表示，校方正在调查该事件中Povey是否使用暴力，以及是否有种族歧视动机。

不过，Dan 说他会提前离开。他在自己的网站上辩护说：“或许我失去了工作，但至少我依旧保有尊严和独立的思想。”

他说，自己被炒鱿鱼是因为他是白人男性，而抗议的学生是少数族裔。在个人主页的陈述中，他写道：“对于美国人及美国各类机构而言，似乎没什么比被指控种族主义（或类似主义）更可怕的了。这导致了我们这里看到的荒谬的事实：如此巨大的机构竟因几个被蛊惑的孩子陷入瘫痪。”

他表示自己有很多出路：“我告诉朋友，再不济我就到中国或者俄罗斯去。但我要告诉各位，不论发生什么，我永远不会道歉，不会退缩。”

最后，我留下几句鲍勃・迪伦的歌词：

我不对我做的任何事感到遗憾我很高兴我战斗了，我只希望我们胜利

按计划，Dan 本月 19 日就开始在 Facebook 西雅图办公室工作，为 Facebook 的语音识别效力。他曾表示希望能扮演好新角色，但如果摆脱不了争议也不足为奇，他说：“我想在我表达了如此的观点之后，恐怕在任何硅谷大公司也撑不了多久。”

但这个计划也生变了。上周五，Dan 在个人网站更新了他的动向：

他说：

我将不再为 Facebook 工作。我本来要在 19 号星期一开始全职工作；他们昨天，15 号星期四告诉我，不是这样。从技术上讲，他们没有撤销 offer；我将被允许以全职合同工的身份为他们工作至多 6 周，同时 (在我的配合下)，他们将对所发生的事情进行独立调查。我是否最终得到全职 offer，将取决于调查结果。我拒绝了那个提议；整件事给我一种似曾相识的感觉。

当然，我知道把这个页面保留下来几乎肯定会结束我在 Facebook 的工作。我周围的每个人都在求我把它撤下；但是我说，我怎么能要求别人要像个男子汉，然后自己却变成一个懦夫呢？

如果有人好奇，我的计划是去一家中国公司工作，也许还会在一所中国大学找到一份兼职。

语音界传奇Dan，开发Kaldi撑起语音识别开源软件半边天非语音方向的读者可能不熟悉 Dan Povey，在语音界，Dan Povey 可以说是一个传奇。

略扫一遍知乎上的讨论，我们发现，Dan 教授在学生中有着极高的声誉，他的一堆 “标签” 甚至让路人圈粉。

他曾经的学生说：“Dan 是我见过的最纯粹耿直善良的 researcher，不仅学术水平极佳，至今仍居 coding 一线，灵感来了写代码写到不舍昼夜，仅靠一个土豆维生。”

工作狂：Dan 是个工作狂，据称，他每天工作 14 小时以上，除了回复邮件，就是在写代码；

热心：关心学生、主动兼任维护服务器、出来开会曾为了帮助穷学生而 share 旅馆，甚至经常给无家可归者钱；

纯粹：他的理想是 “干掉” Nuance（一家早期非常有名的语音识别公司），给大家提供免费的语音识别工具。这让他在并不十分美好的巴尔的摩一呆就是 7 年，全心地开发和维护 Kaldi；Kaldi 的论坛上，几乎每个帖子都能得到回复，Dan 回复邮件几乎是有求必应。

……

Dan Povey 最著名的工作是领导开发了Kaldi，这是一个开源的语音识别工具包，在 Apache 许可下免费提供。

Kaldi 旨在为语音识别开发者提供灵活、可扩展的软件，支持线性 linear transforms、MMI、 boosted MMI 和 MCE 判别训练、特征空间判别训练和深度神经网络，并且已经提供 TensorFlow 集成。

关于 Kaldi 名字的来源，据说 Kaldi 是传说中发现咖啡的咖啡之神的名字，Dan 希望工具包像咖啡那样容易、方便、流行。

现在，Kaldi 已经成为最广泛使用的开源语音识别工具包之一，许多语音识别团队都依靠 Kaldi。这套工具包自 2011 年发布以来，下载量已经超过了两万多次，合著的论文目前也已经被引用一千多次。可以说 Kaldi 撑起了语音识别开源软件的半边天。

Kaldi 的影响是巨大的，它是第一个完全用 C++ 编写的，基于加权有限状态及理论的语音识别开源软件，它的模块化与高度可扩展性设计，详细的说明文档，完备公开的教程，也是它受广大开发者喜爱的一个主要原因。

它目前被业界广泛采用作为标准工具，包括学术界的 MIT、CMU、GHU、剑桥，国内的清华、上海交大等等，工业界包括微软、谷歌、IBM，Facebook 等等，它的推出也极大推进整个语音识别领域的发展。

有趣的是，Dan Povey 也是剑桥大学语音识别工具包 HTK 的作者之一，他是领导 HTK 工具包开发的 Phil Woodland 教授的学生。经过若干年的发展，Kaldi 集成的技术已经多于 HTK，老师开发了第一代语音识别开源软件，学生开发了第二代语音识别开源软件。

最后，欢迎Dan来中国，不知道哪个公司或学校最终能捡到这个宝贝呢。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Facebook

Facebook

+关注

关注
3

文章
1429

浏览量
54634
语音识别

语音识别

+关注

关注
38

文章
1721

浏览量
112533

原文标题：语音界传奇Dan Povey突遭美霍普金斯大学解雇，计划转投中国

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

ASR与传统语音识别的区别

ASR（Automatic Speech Recognition，自动语音识别）与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比：一、技术基础 ASR ：基于深度学习算

发表于 11-18 15:22 •272次阅读

ASR语音识别技术应用

ASR（Automatic Speech Recognition）语音识别技术，是计算机科学与人工智能领域的重要突破，能将人类语音转换为文本，广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR

发表于 11-18 15:12 •225次阅读

物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

01 物联网系统中为什么要使用离线语音识别芯片物联网系统中使用离线语音识别芯片的原因主要基于以下几个方面： 1、实时性与可靠性实时性好：离线语音

发表于 09-26 17:56 •416次阅读

WTK6900FC语音识别模块

语音识别

WT-深圳唯创知音电子有限公司
发布于 :2024年09月25日 17:35:07

唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

语音识别

WT-深圳唯创知音电子有限公司
发布于 :2024年09月12日 17:24:28

吹田电气助力大学生电子设计竞赛，省级赛事圆满落幕！

近日，全国大学生电子设计大赛的省级赛事顺利结束。这一赛事是全国范围内最具影响力的大学生科技创新竞赛之一，吸引了众多优秀学子踊跃参与。北京、湖南、浙江等省级赛事中，吹田电气作为重要的技术支持方，功率

发表于 08-11 08:33 •642次阅读

什么是离线语音识别芯片？与在线语音识别的区别

离线语音识别芯片适用于智能家电等，特点为小词汇量、低成本、安全性高、响应快，无需联网。在线语音识别功能更广泛、识别准确率高，但依赖稳定网络。

发表于 07-22 11:33 •364次阅读

谷歌解雇28名员工，因参与云合同抗议

Google表示，由于员工消极抵抗其与以色列政府签署的云计算合同，已经解雇了28位员工。该公司在声明中强调，抵制行为严重干扰了正常工作秩序，并且违反了其企业政策。

发表于 04-19 12:17 •357次阅读

谷歌因云端合同抗议 28名员工遭解雇

谷歌表示，已完成对事件的个别调查，导致28名员工被解雇，并承诺将继续调查并采取必要措施。然而，谷歌员工在Medium平台上发表声明，指责此次解雇是“公然的报复行为”，并透露一些并未直接参与周二（16日）抗议活动的员工也遭

发表于 04-19 10:02 •303次阅读

离线语音识别与在线语音识别有什么不一样？

离线语音识别与在线语音识别有什么不一样？离线语音识别和在线

发表于 12-12 14:36 •1147次阅读

情感语音识别的应用与挑战

，情感语音识别技术被广泛应用于游戏、电影、音乐等领域。通过识别用户的情感状态，系统可以提供更加个性化的推荐和服务，提高用户的体验和满意度。智能家居：在智能家居领域，情感

发表于 11-30 10:40 •615次阅读

影响语音芯片识别率的因素概述

语音芯片识别率是指芯片对人类语音信号的识别能力。在实际应用中，语音芯片识别率的高低直接影响了用户

发表于 11-27 10:21 •543次阅读

离线语音识别及控制是怎样的技术？

引言：随着人工智能的飞速发展，离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本，无需依赖网络连接，

发表于 11-24 17:44 •1103次阅读

离线语音识别及控制是怎样的技术？

引言：　随着人工智能的飞速发展，离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本，无需依赖网络连

发表于 11-24 17:41

情感语音识别：现状、挑战与解决方案

一、引言情感语音识别是人工智能领域的前沿研究课题，它通过分析人类语音中的情感信息，实现更加智能化和个性化的人机交互。然而，在实际应用中，情感语音识

发表于 11-23 11:30 •795次阅读

搜索历史

语音识别大牛Dan Povey因学生闹剧被约翰·霍普金斯大学解雇

评论

ASR与传统语音识别的区别

ASR语音识别技术应用

物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

WTK6900FC语音识别模块

唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

吹田电气助力大学生电子设计竞赛，省级赛事圆满落幕！

什么是离线语音识别芯片？与在线语音识别的区别

谷歌解雇28名员工，因参与云合同抗议

谷歌因云端合同抗议 28名员工遭解雇

离线语音识别与在线语音识别有什么不一样？

情感语音识别的应用与挑战

影响语音芯片识别率的因素概述

离线语音识别及控制是怎样的技术？

离线语音识别及控制是怎样的技术？

情感语音识别：现状、挑战与解决方案