Zettelkasten
Search
⌘K
Graph
Tags
#
vlm-fine-tuning
3개
Image Shuffle Test는 VLM이 이미지를 보는지 검증하는 필수 sanity check다
759자
vlm-fine-tuning
sanity-check
image-shuffle-test
vision-grounding
OMR용 compact notation은 MusicXML 대비 토큰 효율성을 위해 설계했다
748자
omr
compact-notation
music-representation
vlm-fine-tuning
VLM에서 극단적 aspect ratio는 리사이즈해도, 원본을 넣어도 학습을 실패시킨다
1,137자
vlm-fine-tuning
aspect-ratio
patch-merger
qwen2-5-vl
image-preprocessing