职位&公司对比

招聘中

多模态算法工程师

-K·薪
  • 互联网
  • D轮及以上

职位详情

  • 北京
  • 在校/应届
  • 博士
  • 深度学习
  • 大模型算法
  • 图像生成
  • 多模态算法
  • C/C++
  • Python
  • 发表算法相关优秀论文
  • 参加算法相关竞赛/获奖
  • 模型加速/性能优化

在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作;

 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度直聘学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽;

 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质;

 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视来自BOSS直聘频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法;

 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具;
 在这里,你将帮助淘宝直播等大型的视频传输场景来自BOSS直聘设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 任职要求: 【必备项】 1、硕士及以上学历,计算机等相关专业,有视频或图像编码和处理研究背景; 2、精通C++和C编程,并熟悉视频编解码标准,如AVC、HEVC、VVC、AV1、AVS系列,有相关标准提案,或使用视频编码开源软件或标准参考软件(如X264,X265,VVENC, VTM,JEM,HM,SHM,JM和JSVM)的经验优先考虑; 3、熟练掌握超分辨率、去模糊、降噪及色彩增强等方向的经典画质增强算法或无参视直聘频质量评价算法; 4、熟悉手机端的图像、视频算法的算法开发,包括人脸人体关键点,三维人脸人体重建,美颜、美妆等; 5、熟悉扩散模型及其在视频图像处理、编码、生成中的应用,有相关项目经验或在高影响力开源项目中作出核心贡献; 6、有出色的学习能力、分析研究及创新能力、优异的学术产出。 【加分项】 在NTIRE、AIM、AIS, MSU等权威竞赛获奖者,或在ICCV、CVPR、ECCV、TPAMI、T-CSVT、T-I来自BOSS直聘P 等顶级会议和期刊发表论文者优先考虑;

职位详情

  • 北京
  • 在校/应届
  • 博士
  • Python
  • C++
  • Java
  • 自然语言处理
  • 视觉图像算法
  • 机器学习算法
  • 图像处理
  • 手势识别

岗位职责: 1. 参与作业帮拍照搜索核心业务场景的优化。利BOSS直聘用多模态能力,更好的满足用户汲取知识的诉求,让优质教育触手可及。 2. 参与多模态解题模型,多模态问答等核心模型能力的持续提升。作业帮拥有海量的题目及用户问答数据,依托数据优boss势,探索前沿的多模态大模型训练技术。包括但不限于图文对齐,SFT,RL等关键环节的优化。 3. 探索跨模态信息的融合与交互,构建更智能的多模态模型。 任职要求: 1. 应届博士毕业生,具有多模态大语言模型,机器学习、模式识别、信号处理,图像理解等相关研究方向优先; 2. 有语音合成、图文生成等多模态相关研发经验,精通常用的机器学习算法,紧跟来自BOSS直聘行业最新的生成式算法; 3. 熟练掌握PythBOSS直聘on/C++/Java等开发语言,有较强的算法实现能力; 4. 在相关领域会议或期刊 (如 CVPR、ICCV、EMNLP 等) 发表过论文者优先;

技能解析

专有技能
  • 熟悉手机
  • 深度学习
  • 开源软件
  • 数据结构
  • 框架设计
  • 研发工作
  • 分析研究
  • 创新能力
  • 研究工作
  • 用户体验
  • 研究背景
  • 图像处理
  • 修复工作
  • 视频剪辑
  • 学习能力
  • 视频质量
  • 算法开发
相同技能
  • 机器学习
  • 信号处理

数据来自CSL职业科学研究室

技能解析

专有技能
  • 算法实现
  • 算法实现能力
  • 模式识别
  • 研究方向
  • 机器学习算法
  • 模型训练
  • 学习算法
  • 研发经验
  • 语音合成
  • 开发语言
相同技能
  • 机器学习
  • 信号处理

数据来自CSL职业科学研究室

工作时间

上午09:00   -   下午06:00

工作时间

上午10:00   -   下午07:00
双休弹性工作

公司福利

  • 五险一金
  • 补充医疗保险
  • 年终奖
  • 股票期权
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 节日福利
  • 零食下午茶

公司福利

  • 交通补助
  • 节日福利
  • 有无线网
  • 团建聚餐
  • 餐补
  • 包吃
  • 带薪年假
  • 法定节假日三薪
  • 节假日加班费
  • 股票期权
  • 年终奖
  • 定期体检
  • 意外险
  • 补充医疗保险
  • 五险一金
首页 | 北京招聘 · 图像算法招聘 | 北京图像算法招聘 | 阿里巴巴集团算法工程师-视频编解码(T-star-头部人才)招聘 | 阿里巴巴集团算法工程师-视频编解码(T-star-头部人才) 怎么样
更新于 2025-04-29