文章中提到采访快手业务部门老兵来还原人工智能从 0 到 1 的过程,带着满满的好奇,咱们一起深入了解一番。
多模态内容理解的坚持
深度学习部门起初只有图像和音频单模态内容理解团队,但视频理解出身的李岩坚信多模态内容理解对快手很重要。虽然当时单模态内容理解在学术界不够成熟,且对视频理解研究需求不强烈,导致没有针对视频理解的求解方案,但李岩的坚持为快手人工智能发展埋下重要伏笔。这让快手对不同模态内容有了更全面的处理能力。
在实际应用中,多模态内容理解能够让快手的内容分析更准确,为用户提供更贴合需求的视频推荐。
视频理解现状困境
过去几年,学术领域对视频理解的研究不够深入。不仅单模态内容理解技能不完善,而且其对视频理解缺乏迫切的研究热情,还没形成针对视频理解的成熟解决方法。即便在工业界,像 YouTube 这种全球最大的视频平台,因视频有完善的文本信息,也能绕过视频理解这个难题。这种情况也引发了快手对自身视频理解能力的思考和探索。
这样的行业现状给快手带来挑战,但也意味着可挖掘的潜力巨大,促使快手加大对视频理解的研发。
MMU 的目标与实践
MMU 目标是从低级感知过渡到高层语义理解,李岩认为这是当前工业界最难的问题。而且,为保护未成年人使用快手, MMU 正在研发视频分级系统,这需要算法对视频内容有更深刻理解,即明确视频表达的概念。这种实践体现了快手在人工智能应用上的责任感。
通过视频分级系统的研发,快手能为用户打造更健康的使用环境,同时也推动了人工智能在内容管理方面的发展。
技术研发与产品落地的磨合
Y - Lab 和下游特效团队分属不同部门,沟通问题致使魔法表情上线流程不理想,用户数据也不好。晨星表示,算法从研发到产品落地涉及多个部门,过去团队主要关注研发,现在还要注重产品落地业务。这反映出快手在技术转化上的挑战和努力。
这次经历让团队明白要加强部门间沟通协作,以更有效地将技术转化为实际产品,服务用户。
应对 DAU 目标的举措
6 月 18 日,快手创始人内部信曝光,定下 2020 年春节前实现 3 亿 DAU 的目标。技术部门虽未因这一指标做明显调整,但他们秉持宿华所说的“追求极致”。从侧面可以看出,快手技术团队专注自身发展。
即使目标压力大,技术团队仍按部就班,通过持续提升技术能力,为达成目标提供坚实保障。
音视频领域新探索
快手圣地亚哥实验室负责人王祥林透露,音视频团队的部分工作不为多数内部员工所知,其中快手正参与制定新一代视频压缩标准。这一行动显示出快手在音视频技术领域的探索精神。
通过参与标准制定,快手能在音视频领域占据更有利位置,提升自身竞争力。
看到这里,你认为快手在人工智能领域的这些探索和实践,能让它在未来的竞争中脱颖而出吗?如果觉得文章有用,别忘了点赞和分享!