微软发布了一份 166 页的报告:LMM 的黎明:GPT-4V (ision) 的初步探索。详细探讨了 GPT-4V 的功能,用法和未来方向。微软来真的,我哭死。
报告内容覆盖:
- GPT-4V支持哪些输入和工作模式?
- GPT-4V 在不同领域和任务上的功能质量和通用性如何?
- GPT-4V的有效使用和提示方式有哪些?
- GPT-4V未来有哪些有前景的方向?
报告中提到了很多细节,GPT 4V看图片需要用到一些新的提示词,才能提高看图片的准确性,看来还是角色扮演最实用。
GPT-4V 甚至可以直接看网页,而且有自己的想法该往哪里点。
需要报告地址可以关注“极客开源”在后台回复 GPT4V 获取全部资料
领取专属 10元无门槛券
私享最新 技术干货