感谢您的工作! 您在技术报告中提到使用了powerful captioner对85M图像做的caption,请问可以详细说明一下caption的方式吗?LLaVA-OneVision-1.5-Mid-Training-85M除了在类别均衡采样上做的特别好,caption的质量也特别高,希望得到您的回复,感谢!
感谢您的工作!
您在技术报告中提到使用了powerful captioner对85M图像做的caption,请问可以详细说明一下caption的方式吗?LLaVA-OneVision-1.5-Mid-Training-85M除了在类别均衡采样上做的特别好,caption的质量也特别高,希望得到您的回复,感谢!