|
|
|
|
职位描述
用小程序查看更多
|
|
1.参与大模型训练、测试、性能优化,包括但不限于预训练、SFT、LPO、模型量化、推理加速,进行服务层、推理层和算法层的优化探索,实现整体效率和性能提升; 2.进行推理性能分析和优化,实现对gpu,npu等异构硬件,边缘、云端等各种场景的高效推理技术,研究实现各种模态混合的高效大模型推理技术; 3.熟练使用Python、C、Rust和CUDA编写代码; 4.研究和应用Transformer架构以及相关领域的最新研究成果,探索应用各种能提升大模型推理效率和精度的高效架构; 5.研究从推理层面提升模型逻辑能力的各种方法,研究AIAgent框架,参与构建Agent应用。 |
|
|
|
|
|
|