我理解是gptpdf是整张图送进个gpt4o,只不过图片、table区域被打上了标签, llmdocparser是把每个区域都抠出来送进大模型?一个问题是推理成本会不会高很多,另一个问题是如果想要组装成markdown的话,哪种方式效果好呢?
我理解是gptpdf是整张图送进个gpt4o,只不过图片、table区域被打上了标签, llmdocparser是把每个区域都抠出来送进大模型?一个问题是推理成本会不会高很多,另一个问题是如果想要组装成markdown的话,哪种方式效果好呢?