동식이 블로그

[AI Agent] Crosstalk 만들기 - 3편: 똑똑한 폴링보다 멍청한 콜백이 낫다

Polling을 버리고 Callback으로 — Crosstalk v0.2 회고

v0.1.0이 가장 좋았다 2편까지 패키징을 끝내고 v0.1.6까지 잘 굴러갔다. 그런데 어느 순간 깨달았다. 기능을 붙일수록 본질이 사라졌다. v0.1.0 PoC 시점이 가장 깔끔한 토론기였다. 화면에 답변이 나오면 사회자(Claude)가 직접 보고 다음 사람한테 넘기는 진짜 핑-퐁. 그런데 v0.1.4에서 transport 도입, v0...

[AI Agent] Crosstalk 만들기 - 2편: Claude Code 플러그인으로 패키징하기

스크립트 두세 개를 한 번 깔리는 도구로 — 마켓플레이스, install, i18n까지

1편 끝나고 남은 한 가지 찜찜함 1편에서 /fight 슬래시 커맨드를 만들어서 잘 쓰고 있었다. 그런데 내 손에서만 잘 굴러갔다. 구성은 이랬다. 1 2 ~/.claude/commands/fight.md # 슬래시 커맨드 정의 ~/.claude/scripts/fight_bridge.sh # cmux 통신 헬퍼 이 두...

[AI Agent] Crosstalk 만들기 - 1편: Claude + Codex + Gemini, 셋이서 토론하는 슬래시 커맨드

구독제 그대로 쓰면서 멀티 에이전트 토론장 만들기 (cmux + /fight)

시작은 단순한 의문이었다 요즘 코딩할 때 Claude Max, Codex Pro, Gemini Pro 세 개를 다 구독해서 쓰고 있다. 각 모델 강점이 달라서 작업 종류마다 골라 쓴다. Claude: 긴 컨텍스트, 코드 리팩토링 Codex (GPT-5.5): 추론, 알고리즘 Gemini 3 Pro: 멀티모달, 큰 코드베이스 분석 근...

[AI] 2026 Stanford AI Index를 보며 미래에 대해 생각해보기

AI 시대에 개발자는 무엇을 준비해야 할까

[AI] 2026 Stanford AI Index를 보며 미래에 대해 생각해보기 Stanford HAI에서 2026 AI Index Report가 나왔다. 처음에는 그냥 AI 업계 동향을 보려고 열었는데, 읽다 보니 개발자로서 꽤 현실적으로 생각해볼 지점이 많았다. 특히 이번 리포트에서 계속 보이는 흐름은 AI는 더 빨리 좋아지고 있고, 더 많은...

[Android] Google AI Edge Portal 프라이빗 프리뷰 선정 및 소개

온디바이스 AI 개발의 가장 큰 장벽, 기기 파편화 테스트를 해결해 줄 구글의 새 무기

Google AI Edge Portal 프라이빗 프리뷰 합격 요즘 사이드 프로젝트로 안드로이드 온디바이스 AI(On-device AI)를 붙여보려고 여러 모델과 프레임워크(MediaPipe, LiteRT 등)를 돌려보고 있었다. 온디바이스 AI를 만지다 보면 꼭 부딪히는 벽이 하나 있다. 내 폰(최신 플래그십)에서는 잘 도는데, 다른 기기에서는 어...

[Android] Gemma3/4 vs ML Kit GenAI

온디바이스 텍스트/문서 요약 모델 비교

[Android] Gemma3/4 vs ML Kit GenAI LiteRT로 직접 모델을 돌리다가 ML Kit GenAI로 갈아탄 이유 시작은 LiteRT였다 온디바이스 AI 텍스트/문서 요약을 구현할 때 처음 선택한 스택은 Google LiteRT-LM + Gemma3-1B였다. 선택 이유는 명확했다. Google이 공식 지원하...

[Android] 온디바이스 LLM으로 긴 문서 요약하기

4000자 균등 분할 Map-Reduce 패턴 적용기

[Android] 온디바이스 LLM으로 긴 문서 요약하기 온디바이스 LLM은 컨텍스트 윈도우가 좁다. 긴 문서를 어떻게 요약할까? 배경 온디바이스 sLLM(소형 언어 모델)을 활용해 텍스트/문서 요약 기능을 개발하던 중 현실적인 한계에 부딪혔다. 모델 컨텍스트 윈도우 제한. Gemma3-1B 기준으로 안전하게 처리할 수 있는 입력 토큰...

[Android] 온디바이스 AI 개발기 - 6편: Play Asset Delivery로 모델 배포하기

1GB 모델을 앱에 어떻게 넣나 — 구글이 AI Gallery로 직접 보여준 방법

[Android] 온디바이스 AI 개발기 - 6편: Play Asset Delivery로 모델 배포하기 1GB짜리 모델 파일, 앱에 번들링할 수는 없다. 그럼 어떻게 배포하나. 이 글은 5편에서 1B 모델의 실제 한계를 정리했다. 이번엔 모델 파일 자체를 어떻게 앱에 제공하는지를 다룬다. gemma3-1b-it-int4.litertlm은...

[Android] 온디바이스 AI 개발기 - 5편: 한계 실험기 (요약 / 분류 / 번역 직접 비교)

1B 모델, 실제로 써보면 어디까지 되나

[Android] 온디바이스 AI 개발기 - 5편: 한계 실험기 (요약 / 분류 / 번역 직접 비교) 설치하고 돌려봤다. 잘 되는 것도 있고, 쓰기 어려운 것도 있다. 이 글은 1~4편에서 왜 온디바이스인지, 어떤 엔진을 쓰는지, 세팅은 어떻게 하는지를 정리했다. 이번엔 실제로 여러 태스크를 돌려보면서 1B 모델의 현실적인 한계를 정리한다...

[Android] 온디바이스 AI 개발기 - 4편: GPU 가속, 어떤 기기에서 되나

libOpenCL.so가 있어야 GPU가 된다 — 지원 기기와 런타임 감지 방법

[Android] 온디바이스 AI 개발기 - 4편: GPU 가속, 어떤 기기에서 되나 Backend.GPU를 지정하면 끝인 줄 알았다. 그런데 기기마다 다르다. 이 글은 3편에서 LiteRT-LM 세팅 코드를 정리했다. GPU 백엔드 초기화 부분에서 fallback 처리가 필요하다고 했는데, 이번엔 왜 그런지, 어떤 기기에서 GPU가 되고...