LLM ํ์ต์ํค๋ ์ฝ๋ ๋ชจ์๋ repo
๋๋ต packingํด์ ๋ค์ด๊ฐ๋ฉด attention_mask๊ฐ ์ด๋ฐ์์ผ๋ก ๋ค์ด๊ฐ๊ฒ ๋จ.
๊ทผ๋ฐ flash_attention์ attention_mask ๋ฐ๋ก ์์ฃผ๊ณ , position_ids๋ก ๋ถ๊ฐํจ.
์์ง ์ ์ ์ค ๋์ถฉ ํ์ต ๋๋ ๋ค LogicKor ๋๋ฆฌ๊ธฐ ๊ท์ฐฎ์์ ๋ง๋ ์ฝ๋
ํ์ต ์ค chekcpoint saveํ๊ณ ๋ ๋ค ์ํํจ.
๊ทผ๋ฐ zero-3์์ config ์ค์ ์ ๋ฐ๋ผ eval ํ๋๋ฐ 4์๊ฐ ๊ฑธ๋ฆฌ๋๋ผ