LATEST TIL APR 07, 2026 4 MIN

번역 직접 비교)

1B 모델, 실제로 써보면 어디까지 되나

READ POST

POSTS / RECENT 315 POSTS

P_001

til

[Android] 온디바이스 AI 개발기 - 4편: GPU 가속, 어떤 기기에서 되나

libOpenCL.so가 있어야 GPU가 된다 — 지원 기기와 런타임 감지 방법

APR 06, 2026 3 MIN

P_002

til

[Android] 온디바이스 AI 개발기 - 3편: LiteRT-LM 실전 세팅 (Hilt, GPU, 스트리밍)

의존성 주입부터 GPU 백엔드 초기화, 스트리밍 응답 처리까지

APR 05, 2026 3 MIN

P_003

til

[Android] 온디바이스 AI 개발기 - 2편: MediaPipe에서 LiteRT-LM으로 (삽질기)

구글이 만든 MediaPipe인데 왜 deprecated? 그래서 어디로 갔나

APR 04, 2026 3 MIN

P_004

til

[Android] 온디바이스 AI 개발기 - 1편: 왜 온디바이스인가

서버 AI말고 기기 안에서 돌리는 LLM, 왜 쓰는 걸까

APR 03, 2026 3 MIN

P_005

til

[Android] 온디바이스 AI 삽질기 - 6편: LiteRT-LM으로 갈아타는데 Gemma 4가 나왔다

파인튜닝 열심히 했더니 세상이 바뀌어 있었다

MAR 25, 2026 4 MIN

P_006

til

[Android] 온디바이스 AI 삽질기 - 5편: 파인튜닝 모델을 Android에 올리기 (변환 삽질기)

safetensors → tflite → .task → adb push, 중간에 막히는 게 한두 개가 아니다

MAR 20, 2026 3 MIN

P_007

til

[Android] 온디바이스 AI 삽질기 - 4편: QLoRA 파인튜닝 실전, loss가 안 내려가면 어떡하나

밤에 스크립트 돌려놓고 다음 날 아침에 확인하는 삶

MAR 15, 2026 4 MIN

P_008

til

[Android] 온디바이스 AI 삽질기 - 3편: M1 Mac Mini 16GB로 LLM 파인튜닝 환경 세팅

24GB도 아니고 M1 16GB로 1B 모델 파인튜닝 — 되긴 된다

MAR 10, 2026 4 MIN

P_009

til

[Android] 온디바이스 AI 삽질기 - 2편: 학습 데이터 5만건, Gemini CLI로 하루 만에 만들기

실제 데이터는 못 쓰고, Claude는 비싸고, 그래서 Gemini CLI headless 호출

MAR 05, 2026 3 MIN