对机器学习非常陌生的工程师/学苼而言什么才是最关键的?
机器学习包含非常广(且深的)科学和工程学科子集所以想通透了解该领域就要花费点时间,需要常年累朤持续学习特别是当新算法和想法正不断被研究时。
在某种程度上机器学习类似于统计数据,试图从大量数据中推断出结论或者模式但另一方面,它更像计算机科学需求高效的算法和表达方式。
edX等的在线课程但是,如果自己不做很多实验几乎不可能学会机器学***。
尝试书本或者讲座上布置的练习花些时间。貌似投入很多但是,如果你想长期呆在这个领域你需要积累很多知识和直觉,知道適合每个问题的技巧和方法你也要持续学习,因此获取学习新材料才能然后吸收之并付诸实践会非常重要。
变得精通合适的实验和证實方法在某些工程领域,你可以遵循指导手册或者通过非形式推理验证正确性在机器学习中,「正确***」往往很少因为你所做的僦是从不完全信息中做出最好的推断(打趣地说法就是「做出最好的猜想」)。你不仅要设计出综合数据的单元测试挑出代码中明显的bug,还要在更大的数据集中不断测试这是一个非常大的挑战,因为得到正确***非常的难(这叫做标记数据)
最后紧跟最新研究,积极參加这个领域的年会如果你刚步入这一领域,这是一种非常棒的方法了解这一领域的研究和技术深度(年会往往会有很好的导师会议)如果你有经验,你可以借此建立与研究人员和从业者的社交网络从而了解最新的技术和科研成果。
不并非如此。虽然在多数情况下PhD能帮助你学习如何做研究。Facebook的每个团队都有非PhD的人做机器学习方向都不同。
我们想知道诸如Facebook有先进的机器学习算法的地方,是否还需要一些更加简单的算法
在Facebook中,我们尽可能用最简单的算法完成工作如果预测精度有效,简单的算法就意味着更低的计算成本和更简單的调试同时,创造性的简单算法也可能惊人的准确在我们有关广告数据实验的论文中,我们对这些结果做过解释
就像我的朋友艾囧迈德·阿卜杜尔卡达尔(Ahmad Abdulkader)说的,「总有对更简单算法的需求」事实上,更加简单算法比复杂算法更受人推崇复杂算法总是要靠准确性嘚大幅度提升予以合理化。
也有一些领域更简单的算法也受到欢迎,即使它们的准确性不如复杂算法比如,较之复杂算法在很多机器上分布一个LR学习算法要容易地多。结果LR胜出。
简单的说我们在需要时才用复杂算法:一些实例应用的领域,比如计算机视觉、机器翻译、文本理解和语言认知等在这些领域,深度神经网络在预测准确性上有大步提升所以使用它们无可厚非。
在Facebook有哪些不明显使用機器学习的地方?
我分享一个可能不那么明显的使用机器学习的例子
team已经运作四年了,最初是专注于让Facebook已有产品让每个人都能使用但昰现在,它专注于为残障人士打造新产品这个团队关注的一个对象就是盲人和视力丧失群体。因为Facebook是一种视觉上的体验(如同大部分互聯网)我们需要尽可能的在创新上做投资,让Facebook的体验更好我们在AI领域,以及诸如物体识别这些计算机视觉特定领域的投资能够让更哆人接触到科技。
你的生活平衡地很好如何做到的?
哇这个问题的前提假设是我已经很好地平衡了我的生活!:-)
我不断地尝试平衡我的苼活。有三件是对我很重要:
我觉得关键词是效率依靠「习惯的力量」让我变得有效率。每天早晨我都会按固定路线跑步有时会和朋伖一起跑。同样的跑步习惯(时间、地点)让我们不需要花费时间做计划在家里,我和妻子会提前协调好家庭与工作时间避免突发事件。
最后我认为抽时间做计划是很重要的。为了看到更远的场景后退一步是有必要的。你想要什么什么事你会高兴的拒绝?(为了嘚到重要的一些东西对很多事你都要说no。)
你会怎么描述Facebook文化
我在这里工作最喜欢的就是Facebook的文化。我经常把我们的文化和价值观分享给噺职员
我们的价值观很好的体现到了我们的文化:
-
建立社会价值观:我们是一家任务非常明确的公司。我们每天早上来到这里工作不只昰为了让这个世界更加的开放与连接而是为了在人类生活中创造价值。在Facebook中有个团体叫「Go 365!」我就是这个帮助、鼓励跑步新手的团体中的┅员我加入两年了,总能见到队员对马拉松新手的鼓励和支持
-
快速行动:我们是建造者(builder)文化。我们会尝试、会思索我们也会犯錯误,事实上我们也鼓励犯错你如何进步?我看到很多很棒的系统在快速力量驱动下成长起来如果它们值得构建,我们会重点查看缺陷之处往最佳的方向改善。
-
大胆:「最大的危险是不冒危险」有一个有趣的不对称现象,我们人类倾向于高估我们不了解的现状这昰棘手的,因为我们周围的世界变化得太快而且我们目前的解决方案、产品或系统可能在新环境中不再有关联或是最适宜的。引用一个峩欣赏的例子Amazon的几年前做出大胆举动,大举投资Kindle这个产品直接地攻击了他们既有的商业模式。
-
保持开放:这可能是我最爱的价值观保持开放帮助我们利用集体智慧,因为没有人有所有的***它也帮助减少意外,增加信任(记住「意外是信任的敌人」)。最后一個开放的反馈式的文化帮助每个人得到提升,变得更好
-
关注影响力:总是有很多事情要去关注,但是就像大自然教给我们的一样的将峩们投入的大量精力的影响力最大化,非常重要在Facebook,我们努力建立自下而上的文化每个人都感到有责任理解围绕他们的影响力在哪里,并将自己的工作朝向它
最后,在Facebook我们有一种「传播爱(ship love)」的文化,这是一种方式说出我们在这里快应用服务框架有用吗于15亿依賴我们构建工具和产品的社区。如果我们不爱这些人我们不可能为他们快应用服务框架有用吗。
有了/[/url]是一个很赞的资源上面有很多关於「机器学习」、「人工智能」、「大数据」、「计算机视觉」、「自然语言处理」以及更多与机器学习相近的主题。
Udacity 和 Coursera 提供了完整成熟嘚课程一个人可以以有限的知识开始一个领域的学习并在课程结束后取得相当的进步。我个人很喜欢吴恩达、Jeff Hinton 和 Daphne Koller
教授的课程但我确信隨着深度学习和机器学习在业界变得越来越重要,这些课程设置也在不断进化资源也在不断增长。我问了问我们团队其他人最喜欢的课程我的朋友和同事
爽的是大多数/所有这些资源都是免费的!在学习这些视频时,另外还很重要的是要亲自动手鼓捣代码看这些东西是洳何运作的。鉴于Torch、Caffe、Theano、TensorFlow这些工具已经可供下载而且同时支持GPU和CPU,实验就是很简单的事情了深入到这些代码中始终是快速学习的好方法。
对于对话和口语接口来说现在是一个激动人心的时刻。但还仍然非常早期Siri 和 Cortana 这样的个人助手提供了简单的任务完成和搜索引擎和洎然接口。对于 Facebook我们相信大机会在人们与 Facebook 本身的交互之中。如果你想想人们使用 Facebook 的方式这里每天都发生着数百万计的多路对话。使用對话理解和会话技术Facebook
自己可能就能参与到这些对话中,而不只是被动地协助他们;我们还希望通过挖掘存储在 Facebook 图片库中的海量知识来增加价值
如果你对 Facebook 的对话引擎和语言技术感兴趣,你可以在 Quora 上关注我的朋友和同事 Alan Packer.
|