主题 : Netflix一位数据科学家剪出了上百部爱情片,想教AI认识“亲吻”
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605074
威望: 530126 点
无痕币: 19 WHB
贡献值: 0 点
在线时间: 62865(时)
注册时间: 2008-12-25
最后登录: 2024-06-02

0 Netflix一位数据科学家剪出了上百部爱情片,想教AI认识“亲吻”

7月6日,这可能是一年中最适合亲吻的日子——国际接吻日(International Kissing Day)。
这个节日最早起源于英国。1991年这个节日得到了联合国的承认,也希望让更多人知道,亲吻的美好,这也是人类表达爱意最自然的一种方式。

那么,人工智能可以通过训练了解亲吻吗?
来自Netflix的一位高级数据科学家就对“kiss”镜头情有独钟,并且通过上百部电影接吻情节的定位,成功训练出了可以准确识别电影亲吻桥段的AI模型——模型的独创性在于可以区别亲吻与性行为。
大千世界,无所不能,AI也能检测到"kiss"?随文摘菌一探究竟吧。
让AI区别kiss和sex
作为爱情片的代表情节,“亲吻”一直是很多观众最爱反复观看的镜头。不管是《人鬼情未了》中Swayze和Demi Moore的经典接吻桥段,还是《泰坦尼克号》中Rose和Jack的临别一吻,都造就了经典中的经典。
而在电影观看过程中,寻找kiss镜头,就成为了不少娱乐视频场景下的一个真实需求。
这项基于人工智能识别接吻的研究由出自Netflix高级数据科学家Amir Ziai之手——此时他正在斯坦福大学攻读人工智能研究生学位。
Ziai在上世纪好莱坞电影中挑选了100部有代表性的作品,并为电影片段手动标注“亲吻”或“非亲吻”标签,用静态画面和声音片段来训练深度学习算法,以实现对亲吻场景的画面和声音的识别。
为了避免任何人得到错误的印象,目前还不能确定亲吻识别算法能否用于性爱场景。Ziai说到,“在我的训练集中,我尽量避免出现性爱场景,这样就能确保我的模型不会混淆接吻和性爱。”
Ziai目前的雇主Netflix并没有参与到斯坦福大学的这个项目上,但该项目在arXiv中有详细记载;另外,即使Ziai还没去调研这项研究在Netflix上的应用,但是不难想象,Netflix或其他公司(如YouTube,Facebook,Instagram和TikTok等处理大量流媒体或存储视频的公司)可能会对这一技术的商业应用场景感兴趣。

该图是1990年的电影《人鬼情未了》中Swayze和Demi Moore的经典接吻桥段,数据科学家便是用了近百部类似的电影桥段来训练AI模型识别亲吻的行为。
感兴趣的读者可以阅读论文原文,附上地址:
https://arxiv.org/pdf/1906.01843.pdf
“双管齐下”:不仅视频识别,还有kiss的音频识别
应用于接吻场景视觉识别最成功的深度学习模型是ResNet-18,这是一种图像分类算法,且该算法经来自ImageNet数据库超过一百万张图像的预训练;而为了识别接吻场景的声音,研究人员采用了名为VGGish的深度学习模型,通过每个以秒分段的场景的后960毫秒音频训练。这种双管齐下对接吻的图像和音频同时处理的AI方法使得训练出的模型获得了惊人的F1分(算法精度和准度的加权平均值,度量模型的一种指标)——0.95。

ResNet-18模型结构图
在模型结构中,采用"shortcut connection”方式,也就是上图中的弧线来减少卷积网络传播过程中的计算和参数量,感兴趣的读者可以研究下,VGGish是是产生音频数据集的工具,一般用于音频分类。
github网址如下:
https://github.com/tensorflow/models/tree/master/research/audioset
级别: 十方秋水

UID: 88
精华: 0
发帖: 130200
威望: 221938 点
无痕币: 107700 WHB
贡献值: 0 点
在线时间: 51995(时)
注册时间: 2008-03-18
最后登录: 2024-06-01

谢谢楼主的精彩分享。
Total 0.071897(s) query 5, Time now is:06-02 05:24, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛