之前并没有关注 Facebook 的开发者大会,但是今年的 F8 大会着实让人眼前一亮,特别是在人工智能领域。 来看看都有哪些精彩之处~
前言
经历了前段时间的数据泄露时间风波后,Facebook 今年的 F8 开发者大会于 5 月 1 日在加州圣何塞 McEnery 会议中心开幕。
大会官网:https://www.f8.com/
大会视频链接:https://developers.facebook.com/videos
温馨提示:需要使用科学上网方能观看 😉
本周末也会有 Google IO 2018 和 Microsoft Build 2018,可以关注一下~
Day 1 产品
安全
在经历了之前的风波之后,Mark 一开始就强调了 FB 将会更加重视技术的正确使用。特别是在政治领域的更加严格的验证和筛选。对于广告也启用了工具使得他们更加透明。对于虚假新闻加大打击力度。
更加注重用户的隐私和数据。推出 “清除历史”(Clear History),这项新的隐私功能将可以让用户删除 Facebook 从某些网站和应用中收集的数据。
其实在国内,我们使用互联网就是在 “裸奔”。你的隐私其实在你不知不觉使用各种 App 的时候就被泄露了。只不过国内的大环境和监管比较好,所以风险相对来说小很多。
约会应用
一个非常有趣的应用,集成在 Facebook 之中。当然,它会更加注重隐私,对你的朋友是不可见的 😂。不然真的得尴尬了。当然,在介绍这个应用的时候还是强调了线下的相约,即找到感兴趣的活动,加入,认识新的人。
Instagram, WhatsApp, Messenger也有了小幅的更新。
VR/AR
F8 大会上宣布,Oculus 于今天上市。Oculus Go 正式登陆 23 个国家,它是 Oculus 的第一款 VR 一体机,支持 3 自由度头部追踪。售价 199 美元,比较良心。
Facebook 推出了一些新的方法,帮助用户在虚拟现实的世界里帮助用户更好的和好友和家人互动:聚会空间、玩桌面游戏、看电影电视、体育赛事等。还会自动把用户给卡通化,并在 VR 中支持面部表情。非常酷。
Day 2 AI & 研究
PyTorch 1.0
在 PyTorch 项目一年多以前启动以来,其社区、用户数量在不断增加。越来越多的学者使用 PyTorch 来实现或复现论文的成果。但其不足之处在于企业无法把模型应用到现成的产品之中,Tensorflow 在这一方面就更加成熟一些,这也是为什么众多企业会采用 Tensorflow 来部署模型到生产环境中。
那么 Facebook 自家使用的是 Caffe2 来部署,其天生的好处是用 C/C++,编译之后运行效率高。但推出之后在学术界一直不温不火。ONNX 是去年 Facebook, Amazon, Microsoft 共同推出的在不同深度学习框架之间互相转换模型的协议和工具。那么 PyTorch 1.0 就是结合了这三者,把 研究 -> 部署 这个过程变得更加容易。
为了支持这一特性,PyTorch 做了一个 JIT (Just-In-Time Compiler),即时编译器。后端应该是和 Caffe2 结合起来了。具体的使用还得等到发布之后才能一探究竟。
更大型的数据集
这就是直接 开挂 了。用 Instagram 和 Facebook 上用户标注的照片来作为训练集,一共是 35 亿张图片。对,3.5 billion。不服不行。
然后 Facebook 用在 3.5 亿张图片上训练过的模型到 COCO 和 ImageNet 上做 Fine-tune,直接提升了 2 个百分点。
Detecion & DensePose
目标检测上肯定还是用的是 Kaiming He 的 Mask-RCNN 了。下图展示了这一问题近期的研究趋势。
不止如此,在检测人姿态的同时,还同时能够输出深度信息。下面是 DensePose,可以进行实时检测。
可以预想的是,以上的技术可以为未来的 AR 应用铺路,只需要 2D 摄像头和手机,就可以完成一些复杂的功能。而这一切,都是得益于 AI 技术。
开源地址
应该都会有 Pretrained 的模型的。可以在 https://facebook.ai/developers/tools找到这些发布的工具。
整个框架, 包含了视觉 (Vision)、语言 (Language)、推理 (Reasoning) 三大前沿 AI 任务。
如果需要快速开发产品,直接拿 Facebook 的用就行了。真的强。
ELF 围棋 AI
Facebook 开源了其基于强化学习的围棋算法,来对标 Alpha Go。不同的是,这个模型只需要一块 GPU 就可以实时运行,强调了效率。
当然,Facebook 还开源了其它基于强化学习和推理的项目:House3D 和 TorchCraft (AI 玩星际争霸)
VR 应用
除了 3D 构建、手势识别,比较好玩的是这个卡通形象生成。这样在 VR 的世界里就会更加生动。
3D 全景重构建
不同于传统的方法,Facebook 提出利用双目摄像头拍摄全景图,自动计算出景深信息,最后合成出 3D 图像。对于 VR 应用中现实世界的构建非常有用。
总结
本次大会亮点挺多,从产品到研究,从社交、VR 再到 AI,Facebook 的布局也越来越明晰。
值得一提,Google IO 2018 将会在 5 月 8-10 号举行,Microsoft Build 2018 也会在 5 月 7 号开始。不妨关注一下,看看最新的行业应用及走向。