You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: CHANGELOG.md
+6Lines changed: 6 additions & 0 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -54,6 +54,10 @@ v0.2.0 에서 폐기됐던 CLI 를 별도 이름 (`rhwp-py`) 으로 재도입.
54
54
- Content-addressed alias `hwp_ir_v1-sha256-<hash>.json` — `publish-schema.yml` 가 매 deploy 시 hash-tagged immutable copy 를 alongside 발행. 구 hash 는 영구 보존 (SchemaStore / 외부 도구 reproducibility).
55
55
-`_harden_unknown_variant` 가 `_KNOWN_KINDS` SSOT 를 사용 — `TocEntryBlock.kind="toc_entry"` 같은 leaf-only kind 가 not.enum 에 포함되어 라운드트립 깨지는 케이스 회피.
56
56
57
+
### Fixed
58
+
59
+
- LangChain `HwpLoader(mode="ir-blocks")` 와 CLI `rhwp-py blocks --format text` 가 각주·미주·캡션 본문을 평문화할 때 `ParagraphBlock` 만 처리하여 `ListItemBlock` 으로 변환된 list 항목이 RAG 색인에서 통째로 누락되던 문제 정정. 신규 `rhwp.ir._plain_text` 모듈에 `ParagraphBlock` + `ListItemBlock` + `FormulaBlock` + `FieldBlock` 평문 추출 SSOT 헬퍼 (`block_inline_text` / `join_inline_blocks`) 를 도입하고 integration / CLI 양쪽에서 공유한다. caption 평문화도 동일 정책으로 통합 (`langchain.py::_caption_plain_text` / `cli/ir.py::_caption_plain` 제거).
60
+
57
61
### Documentation
58
62
59
63
-`docs/roadmap/v0.3.0/ir-expansion.md` — IR 확장 spec (8 결정 사항 + research 인용).
@@ -68,6 +72,8 @@ v0.2.0 에서 폐기됐던 CLI 를 별도 이름 (`rhwp-py`) 으로 재도입.
68
72
-`tests/test_cli.py` — typer.testing.CliRunner 기반 smoke + 통합 (parse/version/schema/ir/blocks/chunks 전 서브커맨드 + exit code 1/2 검증 + langchain-text-splitters 미설치 monkeypatch).
69
73
-`tests/test_langchain_loader_ir.py` 확장 — `include_furniture` 옵션 4 테스트.
70
74
- CI `test-without-extras` skip count 4 → 5 (typer 추가).
75
+
-`tests/test_ir_plain_text.py` 신규 + footnote/caption 회귀 테스트 (LangChain·CLI 양쪽) — ListItemBlock 누락 정정 가드.
76
+
- 테스트 docstring 의 가변 카운트·스테이지 마커 정리 — 다른 파일·CI 잡에 의존하는 카운트가 박혀 있어 stale 되는 안티패턴 (`5 skipped 카운트 중 1` / `exactly 29 테스트 유지` 등) 제거, SSOT 단일화.
0 commit comments