职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
1、负责验证及应用各类开源AI分布式训练技术;
2、负责AI推理引擎的架构设计、系统开发及优化;
3、研究业界多语言NLP / 多模态大模型,探索自然语言、多模态技术在业务中的落地和创新,并迅速进行转化。
任职要求:
1、精通 PyTorch,了解 Tensorflow/Caffe 等任意一种深度学习框架,并掌握 DeepSpeed/NVIDIA Megatron/Colossal-AI等分布式训练框架;
2、熟悉 BERT / GPT-3 / LLaMa / Diffusion 等当前热门的 CV/NLP/Audio 模型,有百亿以上大模型训练调优经验者优先;
3、具备良好的编程能力,熟练掌握 Python、数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git;
4、了解并行计算、CUDA、网络通信、系统优化、集群硬件架构等相关知识;
5、至少一年以上的深度学习、对话系统、文本生成等实际项目经验;
6、有分布式集群、多机多卡大模型预训练、微调及推理经验者优先;
7、具备英文专业文献阅读能力,能主动跟踪发展现状;
8、计算机、人工智能、机器学习等相关专业本科及以上学历。
工作地点
地址:南京秦淮区南京-秦淮区紫云智慧广场
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
HR
联通智网科技有限公司
- 通信/电信/网络设备/增值服务
- 公司规模未知
- 国有企业
- 西城区