(资料图)

品玩6月30日讯,据 Arxiv 页面显示,Contextual AI 与斯坦福大学近日联手公布一款名为LENS的产品,旨在利用大语言模型的能力来解决计算机视觉问题。

研发团队表示,LENS 使用大语言模型来对一组独立的、高度描述的视效模块的输出进行推理,以提供对图像的详尽信息。

研究团队表示,使用 LENS 的大语言模型在大部分场景中都表现出了高度的竞争力,而不需要任何多模态训练。


关键词: