职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
1、负责开发适应网络安全行业产品需求的大语言模型,提升产品的智能化水平和用户体验;
2、针对特定场景(如运营商、金融、医疗、教育、电力能源、交通等),进行大模型的微调与优化,确保模型在特定领域的性能表现;
3、基于大语言模型,设计和开发智能化工具,赋能企业内部工作流程,如自动化文档生成、智能助手、智能客服、数据分析与决策支持等;
4、推动大模型在企业内部的应用,优化跨部门协作、知识共享和项目管理流程。
岗位要求:
1、硕士及以上学历,计算机科学、人工智能、机器学习、自然语言处理(NLP)等相关领域/专业;
2、有3年以上大语言模型或NLP相关项目经验,具备从0到1开发大模型产品的能力;
3、具有相关数学与理论基础。掌握线性代数、概率论、微积分和信息论等数学基础;掌握机器学习基础,对Transformer架构和预训练任务有深入理解;
4、具有相关工程实现能力。熟练掌握Python,熟悉PyTorch/TensorFlow/JAX框架,能够高效实现模型结构和训练逻辑;具有分布式训练和性能调优经验;
5、具有数据处理与工程化经验,具有数据管道构建和存储与加载优化经验;
6、具有模型训练与调试经验,例如超参数优化和故障排查;
7、具有监督微调(SFT)经验,熟悉任务适配与数据设计、训练策略优化以及评估与迭代等;
8、具有模型蒸馏(KD)经验,熟悉知识迁移方法、模型压缩技术和资源敏感优化等;
9、具有持续学习和跨团队协作的能力。
工作地点
地址:杭州滨江区杭州-滨江区迪普科技18楼


职位发布者
HR
杭州迪普科技股份有限公司

-
行业未知
-
公司规模未知
-
公司性质未知
-
浙江省杭州市滨江区通和路68号中财大厦6楼