职位&公司对比
职位详情
- 杭州
- 1-3年
- 本科
- C++
- 图形开发经验
- 图形开发/渲染
- 深度学习
- python
- 机器视觉
- 模型
岗位职责: 1、针对项目需求,能够结合现有的深度来自BOSS直聘学习BOSS直聘技术提出解决方案; 2、实现、训练、优化主流的深度学习算法; 任职要求: 1、熟练掌握python语言,可用python语言进行常用深度网络模型的搭建、训练及优BOSS直聘化; 2、熟悉常用深度学习网络架构,如CNN,yolo等; 3、有工业视觉外观检测项目经验者优先; 4、有C++、opencv基础者优先;
职位详情
- 杭州
- 3-5年
- 本科
- Python
- JavaScript
- FFmpeg
- 音视频/流媒体开发
一、核心技术能力 1. 计算机视觉与深度学习 -视频分析与理解: 精通目标检测(YOLO、Faster R-CNN)、场景分割(Mask R-CNN)、动作识别(3D CNN、TSN)等算法。 - 熟悉视频关键帧提取、镜头边界检测、内容摘要生成技术。 - **生成式AI技术**: - 掌握生成对抗网络(GAN)、扩散模型(Stable Diffusion、Sora)用于视频合成、风格迁移或修复。 - 熟悉文本/语音驱动视频生成(如LipSync、Talking Head)。 2. 音视频处理与编解码 视频处理框架: - 熟练使用FFmpeg、GStreamer处理视频切割、拼接、转码、滤镜添加。 - 熟悉 OpenCV 实现图像增强、运动追踪、绿幕抠像(Chromakey)。 - 编解码与压缩: - 直聘理解 H.264/H.265、AV1 等编码标准,能优化视频压缩效率与画质平衡。 - 熟悉流媒体协议(RTMP、HLS、WebRTC)与低延迟传输技术。 3. 智能剪辑算法 - 自动化剪辑逻辑: - 设计基于内容语义的剪辑规则(如高潮片段提取、多机位自动切换)。 - 实现AI驱动的B-Roll素材匹配、转场效果推荐。 - 多模态融合: - 结合语音识别(ASR)、自然语言处理(NLP)实现字幕自动生成与对齐。 - 利用情感分析优化视频节奏与音乐匹配。 --- 二、工程化与性能优化 1. 编程与开发工具 - 语言与框架: - 精通 Python(OpenCV、PyTorch)、C++(高性能计算),熟悉 CUDA加速。 - 掌握深度学习框架(PyTorch、TensorFlow)及视频处理库(MoviePy、Scikit-video)。 - 开发环境: - 熟悉 Docker 容器化部署,云服务(AWS Elemental、阿里云视频处理)集成经验。 2. 性能优化 - 实时处理能力: - 优化算法延迟(如模型轻量化、TensorRT 推理加速)。 - 多线程/分布式处理大规模视频(如 Spark、Ray)。 - 资源管理: - 平衡 GPU/CPU 资源占用,设计分级处理策略(如实时预览 vs 离线渲染)。 三、行业知识与工具 1. 行业标准与工具来自BOSS直聘链 - 专业工具集成: - 熟悉 Adobe Premiere/AE 插件开发,或 DaVinci Resolve SDK 的调用。 - 了解第三方AI服务(如 Runway ML、Descript)的API集成。 - 版权与合规: - 理解数字水印、DRM 技术,规避版权风险(如素材合规性检查)。 2. 垂直场景经验(加分项) - 短视频领域: - 熟悉抖音/快手/TikTok 风格化特效(如AR滤镜、模板生成)。 - 影视工业: - 了解影视级合成技术(光流法补帧、HDR调色)。 - 教育/直播: - 开发课件自动剪辑、直播实时高光片段提取系统。 四、软技能与协作能力 - 跨团队协作: - 创新能力: - 快速跟进前沿技术(如Sora生成式视频、NeRF三维重建)。 - 用户体验敏感度: - 平衡自动化效果与人直聘工干预需求(如AI剪辑后的手动微调接口设计)。
技能解析
- 解决方案
- 外观检测
- 学习算法
- 提出解决方案
- 深度学习算法
- 深度学习
数据来自CSL职业科学研究室
技能解析
- 深度学习框架
- 计算机视觉
- 优化算法
- 图像增强
- 行业标准
- CUDA
- 用户体验敏感
- 了解影视
- 协作能力
- 创新能力
- 资源管理
- 用户体验
- 开发工具
- 团队协作
- 自然语言
- 性能优化
- 视频合成
- 开发环境
- 深度学习
数据来自CSL职业科学研究室
工作时间
工作时间
公司福利
- 五险一金
- 定期体检
- 年终奖
- 带薪年假
- 员工旅游
- 餐补
- 节日福利
- 企业年金
公司福利
- 节日福利
- 股票期权
- 底薪加提成
- 五险一金