生成式AI系统现已具备前所未有的能力,能够生成类人文本、总结复杂文档、提出新药方案或创作受多种人类艺术风格启发的作品。如今,大型语言模型这一生成式AI形式已被应用于支撑它们的技术基础:计算机编码。
某机构推出基于云的代码生成服务,利用机器学习和大型语言模型提升开发者的工作效率。该系统在集成开发环境(IDE)中运行,实时分析开发者已编写的代码和自然语言注释,动态推荐符合开发意图的代码块(通常为15-30行),这些代码并非简单复制粘贴,而是融合编码最佳实践的定制化生成。
初始版本支持Python、Java和JavaScript,后续新增对C#和TypeScript的语言支持。通过处理开发者编写的代码和注释,系统能持续优化对代码意图的理解,提供更精准的代码建议。
为解决公共数据集训练可能带来的安全漏洞、毒性内容和偏见问题,该系统实施多重保障机制:
为平衡计算资源与响应速度,研发团队采用模型量化和内存访问优化等自研技术,确保在毫秒级延迟内提供多建议输出。同时开发了支持10+编程语言的基准评估工具MBXP,通过新型转译器自动转换Python基准数据集(MBPP)的输入文本和测试用例,实现多语言代码生成能力评估。
研究表明,大型语言模型展现出零样本代码翻译能力——能依据语言A的参考代码更准确地生成语言B的代码。该基准工具还可用于探究代码生成模型的输入鲁棒性、代码插入能力以及少样本学习对减少语法错误的影响。
代码生成技术正推动编程的民主化进程。正如生成式AI艺术让任何人都能通过提示词创作艺术作品,代码自动化虽尚未达到同等水平,但AI对编程和自然语言的高级理解将不仅增强开发者专业能力,更为更广泛群体打开编程大门。这标志着编程范式正在发生根本性转变。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。