Supports Markdown rendering

马一丁
Commit 997a3283496a876be08c903d0c8cfe6b181c4af3 997a3283 1 parent 728293b8
Showing 3 changed files with 660 additions and 0 deletions
ReportEngine/renderers/__init__.py
ReportEngine/renderers/markdown_renderer.py
ReportEngine/renderers/pdf_renderer.py
--- a/ReportEngine/renderers/__init__.py
View file @997a328
+++ b/ReportEngine/renderers/__init__.py
View file @997a328
@@ -16,10 +16,12 @@ from .pdf_layout_optimizer import (
     ChartLayout,
     GridLayout,
 )
+from .markdown_renderer import MarkdownRenderer
 __all__ = [
     "HTMLRenderer",
     "PDFRenderer",
+    "MarkdownRenderer",
     "PDFLayoutOptimizer",
     "PDFLayoutConfig",
     "PageLayout",
--- a/ReportEngine/renderers/markdown_renderer.py 0 → 100644
View file @997a328
+++ b/ReportEngine/renderers/markdown_renderer.py 0 → 100644
View file @997a328
+from __future__ import annotations
+
+import json
+from typing import Any, Dict, List
+
+from loguru import logger
+
+
+class MarkdownRenderer:
+    """
+    将 Document IR 转为 Markdown。
+
+    - 图表与词云统一降级为数据表格，避免丢失关键信息；
+    - 尽量保留通用特性（标题、列表、代码、表格、引用等）；
+    - 对不常见特性（callout/kpiGrid/engineQuote等）使用近似替换。
+    """
+
+    def __init__(self) -> None:
+        self.document: Dict[str, Any] = {}
+        self.metadata: Dict[str, Any] = {}
+
+    def render(self, document_ir: Dict[str, Any]) -> str:
+        """入口：将IR转换为Markdown字符串"""
+        self.document = document_ir or {}
+        self.metadata = self.document.get("metadata", {}) or {}
+
+        parts: List[str] = []
+        title = self.metadata.get("title") or self.metadata.get("query") or "报告"
+        if title:
+            parts.append(f"# {self._escape_text(title)}")
+            parts.append("")
+
+        for chapter in self.document.get("chapters", []) or []:
+            chapter_md = self._render_chapter(chapter)
+            if chapter_md:
+                parts.append(chapter_md)
+
+        return "\n".join(part for part in parts if part is not None).strip()
+
+    # ===== 章节与块级渲染 =====
+
+    def _render_chapter(self, chapter: Dict[str, Any]) -> str:
+        lines: List[str] = []
+        title = chapter.get("title") or chapter.get("chapterId")
+        if title:
+            lines.append(f"## {self._escape_text(title)}")
+            lines.append("")
+        body = self._render_blocks(chapter.get("blocks", []))
+        if body:
+            lines.append(body)
+        return "\n".join(lines).strip()
+
+    def _render_blocks(self, blocks: List[Dict[str, Any]] | None, join_with_blank: bool = True) -> str:
+        rendered: List[str] = []
+        for block in blocks or []:
+            md = self._render_block(block)
+            if md is None:
+                continue
+            md = md.strip()
+            if md:
+                rendered.append(md)
+        if not rendered:
+            return ""
+        separator = "\n\n" if join_with_blank else "\n"
+        return separator.join(rendered)
+
+    def _render_block(self, block: Any) -> str:
+        if block is None:
+            return ""
+        if isinstance(block, str):
+            return self._escape_text(block)
+        if not isinstance(block, dict):
+            return ""
+
+        block_type = block.get("type") or ("paragraph" if block.get("inlines") else None)
+        handlers = {
+            "heading": self._render_heading,
+            "paragraph": self._render_paragraph,
+            "list": self._render_list,
+            "table": self._render_table,
+            "swotTable": self._render_swot_table,
+            "pestTable": self._render_pest_table,
+            "blockquote": self._render_blockquote,
+            "engineQuote": self._render_engine_quote,
+            "hr": lambda b: "---",
+            "code": self._render_code,
+            "math": self._render_math,
+            "figure": self._render_figure,
+            "callout": self._render_callout,
+            "kpiGrid": self._render_kpi_grid,
+            "widget": self._render_widget,
+            "toc": lambda b: "",
+        }
+        if block_type in handlers:
+            return handlers[block_type](block)
+
+        if isinstance(block.get("blocks"), list):
+            return self._render_blocks(block["blocks"])
+
+        return self._fallback_unknown(block)
+
+    def _render_heading(self, block: Dict[str, Any]) -> str:
+        level = block.get("level", 2)
+        level = max(1, min(6, level))
+        hashes = "#" * level
+        text = block.get("text") or ""
+        subtitle = block.get("subtitle")
+        subtitle_text = f" _{self._escape_text(subtitle)}_" if subtitle else ""
+        return f"{hashes} {self._escape_text(text)}{subtitle_text}"
+
+    def _render_paragraph(self, block: Dict[str, Any]) -> str:
+        return self._render_inlines(block.get("inlines", []))
+
+    def _render_list(self, block: Dict[str, Any]) -> str:
+        list_type = block.get("listType", "bullet")
+        items = block.get("items") or []
+        lines: List[str] = []
+        for idx, item_blocks in enumerate(items):
+            prefix = "-"
+            if list_type == "ordered":
+                prefix = f"{idx + 1}."
+            elif list_type == "task":
+                prefix = "- [ ]"
+            content = self._render_blocks(item_blocks, join_with_blank=False)
+            if not content:
+                continue
+            content_lines = content.splitlines() or [""]
+            first = content_lines[0]
+            lines.append(f"{prefix} {first}")
+            for cont in content_lines[1:]:
+                lines.append(f"  {cont}")
+        return "\n".join(lines)
+
+    def _render_table(self, block: Dict[str, Any]) -> str:
+        rows = block.get("rows") or []
+        if not rows:
+            return ""
+
+        header_cells: List[str] = []
+        body_rows: List[List[str]] = []
+
+        # 检测首行是否声明为表头
+        first_row_cells = rows[0].get("cells") if isinstance(rows[0], dict) else None
+        has_header = bool(first_row_cells and any(cell.get("header") or cell.get("isHeader") for cell in first_row_cells))
+
+        # 计算最大列数，忽略rowspan
+        col_count = 0
+        for row in rows:
+            cells = row.get("cells") if isinstance(row, dict) else None
+            span = 0
+            for cell in cells or []:
+                span += int(cell.get("colspan") or 1)
+            col_count = max(col_count, span)
+
+        if has_header and first_row_cells:
+            header_cells = [self._render_cell_content(cell) for cell in first_row_cells]
+            rows = rows[1:]
+        else:
+            header_cells = [f"列{idx + 1}" for idx in range(col_count or (len(first_row_cells or []) or 1))]
+
+        for row in rows:
+            if not isinstance(row, dict):
+                continue
+            cells = row.get("cells") or []
+            row_cells: List[str] = []
+            for cell in cells:
+                text = self._render_cell_content(cell)
+                span = int(cell.get("colspan") or 1)
+                row_cells.append(text)
+                if span > 1:
+                    row_cells.extend([""] * (span - 1))
+            while len(row_cells) < len(header_cells):
+                row_cells.append("")
+            body_rows.append(row_cells[: len(header_cells)])
+
+        lines = [
+            self._markdown_row(header_cells),
+            self._markdown_separator(len(header_cells)),
+        ]
+        for row in body_rows:
+            lines.append(self._markdown_row(row))
+        return "\n".join(lines)
+
+    def _render_swot_table(self, block: Dict[str, Any]) -> str:
+        title = block.get("title") or "SWOT 分析"
+        summary = block.get("summary")
+        quadrants = [
+            ("strengths", "S 优势"),
+            ("weaknesses", "W 劣势"),
+            ("opportunities", "O 机会"),
+            ("threats", "T 威胁"),
+        ]
+
+        lines = [f"### {self._escape_text(title)}"]
+        if summary:
+            lines.append(self._escape_text(summary))
+
+        for key, label in quadrants:
+            items = self._normalize_swot_items(block.get(key))
+            lines.append(f"#### {label}")
+            if not items:
+                lines.append("> 暂无数据")
+                continue
+            table_lines = [
+                self._markdown_row(["序号", "要点", "详情", "标签"]),
+                self._markdown_separator(4),
+            ]
+            for idx, item in enumerate(items, start=1):
+                tags = [val for val in (item.get("impact"), item.get("priority")) if val]
+                tag_text = " / ".join(self._escape_text(t) for t in tags) or ""
+                detail = item.get("detail") or item.get("description") or item.get("evidence") or ""
+                table_lines.append(
+                    self._markdown_row([
+                        str(idx),
+                        self._escape_text(item.get("title") or "未命名要点", for_table=True),
+                        self._escape_text(detail, for_table=True),
+                        self._escape_text(tag_text, for_table=True),
+                    ])
+                )
+            lines.append("\n".join(table_lines))
+        return "\n\n".join(lines)
+
+    def _render_pest_table(self, block: Dict[str, Any]) -> str:
+        title = block.get("title") or "PEST 分析"
+        summary = block.get("summary")
+        dimensions = [
+            ("political", "P 政治"),
+            ("economic", "E 经济"),
+            ("social", "S 社会"),
+            ("technological", "T 技术"),
+        ]
+
+        lines = [f"### {self._escape_text(title)}"]
+        if summary:
+            lines.append(self._escape_text(summary))
+
+        for key, label in dimensions:
+            items = self._normalize_pest_items(block.get(key))
+            lines.append(f"#### {label}")
+            if not items:
+                lines.append("> 暂无数据")
+                continue
+            table_lines = [
+                self._markdown_row(["序号", "要点", "详情", "标签"]),
+                self._markdown_separator(4),
+            ]
+            for idx, item in enumerate(items, start=1):
+                tags = [val for val in (item.get("impact"), item.get("weight"), item.get("priority")) if val]
+                tag_text = " / ".join(self._escape_text(t) for t in tags) or ""
+                detail = item.get("detail") or item.get("description") or ""
+                table_lines.append(
+                    self._markdown_row([
+                        str(idx),
+                        self._escape_text(item.get("title") or "未命名要点", for_table=True),
+                        self._escape_text(detail, for_table=True),
+                        self._escape_text(tag_text, for_table=True),
+                    ])
+                )
+            lines.append("\n".join(table_lines))
+        return "\n\n".join(lines)
+
+    def _render_blockquote(self, block: Dict[str, Any]) -> str:
+        inner = self._render_blocks(block.get("blocks", []))
+        return self._quote_lines(inner)
+
+    def _render_engine_quote(self, block: Dict[str, Any]) -> str:
+        title = block.get("title") or block.get("engine") or "引用"
+        inner = self._render_blocks(block.get("blocks", []))
+        header = f"**{self._escape_text(title)}**"
+        return self._quote_lines(f"{header}\n{inner}" if inner else header)
+
+    def _render_code(self, block: Dict[str, Any]) -> str:
+        lang = block.get("lang") or ""
+        content = block.get("content") or ""
+        return f"```{lang}\n{content}\n```"
+
+    def _render_math(self, block: Dict[str, Any]) -> str:
+        latex = self._normalize_math(block.get("latex", ""))
+        if not latex:
+            return ""
+        return f"$$\n{latex}\n$$"
+
+    def _render_figure(self, block: Dict[str, Any]) -> str:
+        caption = block.get("caption") or "图像内容占位"
+        return f"> ![图示占位]({''}) {self._escape_text(caption)}"
+
+    def _render_callout(self, block: Dict[str, Any]) -> str:
+        tone = block.get("tone") or "info"
+        title = block.get("title")
+        inner = self._render_blocks(block.get("blocks", []))
+        header = f"**{self._escape_text(title)}** [{tone}]" if title else f"[{tone}]"
+        content = header if not inner else f"{header}\n{inner}"
+        return self._quote_lines(content)
+
+    def _render_kpi_grid(self, block: Dict[str, Any]) -> str:
+        items = block.get("items") or []
+        if not items:
+            return ""
+        header = ["指标", "数值", "变化"]
+        lines = [self._markdown_row(header), self._markdown_separator(len(header))]
+        for item in items:
+            label = item.get("label") or ""
+            value = f"{item.get('value', '')}{item.get('unit') or ''}"
+            delta = self._format_delta(item.get("delta"), item.get("deltaTone"))
+            lines.append(self._markdown_row([
+                self._escape_text(label, for_table=True),
+                self._escape_text(value, for_table=True),
+                self._escape_text(delta, for_table=True),
+            ]))
+        return "\n".join(lines)
+
+    def _render_widget(self, block: Dict[str, Any]) -> str:
+        widget_type = (block.get("widgetType") or "").lower()
+        title = block.get("title") or (block.get("props", {}) or {}).get("title")
+        title_prefix = f"**{self._escape_text(title)}**\n\n" if title else ""
+
+        if widget_type.startswith("chart.js"):
+            chart_table = self._render_chart_as_table(block)
+            return f"{title_prefix}{chart_table}".strip()
+        if "wordcloud" in widget_type:
+            cloud_table = self._render_wordcloud_as_table(block)
+            return f"{title_prefix}{cloud_table}".strip()
+
+        data_preview = ""
+        try:
+            data_preview = json.dumps(block.get("data") or {}, ensure_ascii=False)[:200]
+        except Exception:
+            data_preview = ""
+        note = "> 数据组件暂不支持Markdown渲染"
+        return f"{title_prefix}{note}" + (f"\n\n```\n{data_preview}\n```" if data_preview else "")
+
+    # ===== 工具方法 =====
+
+    def _render_chart_as_table(self, block: Dict[str, Any]) -> str:
+        data = self._coerce_chart_data(block.get("data") or {})
+        labels = data.get("labels") or []
+        datasets = data.get("datasets") or []
+        if not labels or not datasets:
+            return "> 图表数据缺失，无法转为表格"
+
+        headers = ["类别"] + [
+            ds.get("label") or f"系列{idx + 1}"
+            for idx, ds in enumerate(datasets)
+        ]
+        lines = [self._markdown_row(headers), self._markdown_separator(len(headers))]
+        for idx, label in enumerate(labels):
+            row_cells = [self._escape_text(self._stringify_value(label), for_table=True)]
+            for ds in datasets:
+                series = ds.get("data") or []
+                value = series[idx] if idx < len(series) else ""
+                row_cells.append(self._escape_text(self._stringify_value(value), for_table=True))
+            lines.append(self._markdown_row(row_cells))
+        return "\n".join(lines)
+
+    def _render_wordcloud_as_table(self, block: Dict[str, Any]) -> str:
+        items = self._collect_wordcloud_items(block)
+        if not items:
+            return "> 词云数据缺失，无法转为表格"
+
+        lines = [
+            self._markdown_row(["关键词", "权重", "类别"]),
+            self._markdown_separator(3),
+        ]
+        for item in items:
+            lines.append(
+                self._markdown_row([
+                    self._escape_text(item.get("word", ""), for_table=True),
+                    self._escape_text(self._stringify_value(item.get("weight")), for_table=True),
+                    self._escape_text(item.get("category", "") or "-", for_table=True),
+                ])
+            )
+        return "\n".join(lines)
+
+    def _render_cell_content(self, cell: Dict[str, Any]) -> str:
+        blocks = cell.get("blocks") if isinstance(cell, dict) else None
+        return self._render_blocks_as_text(blocks)
+
+    def _render_blocks_as_text(self, blocks: List[Dict[str, Any]] | None) -> str:
+        texts: List[str] = []
+        for block in blocks or []:
+            texts.append(self._render_block_as_text(block))
+        return " ".join(filter(None, texts))
+
+    def _render_block_as_text(self, block: Any) -> str:
+        if isinstance(block, str):
+            return self._escape_text(block, for_table=True)
+        if not isinstance(block, dict):
+            return ""
+        block_type = block.get("type")
+        if block_type == "paragraph":
+            return self._render_inlines(block.get("inlines", []), for_table=True)
+        if block_type == "heading":
+            return self._escape_text(block.get("text") or "", for_table=True)
+        if block_type == "list":
+            items = []
+            for sub in block.get("items") or []:
+                items.append(self._render_blocks_as_text(sub))
+            return "; ".join(filter(None, items))
+        if block_type == "math":
+            return f"${self._normalize_math(block.get('latex', ''))}$"
+        if block_type == "code":
+            return block.get("content", "") or ""
+        if block_type == "widget":
+            return self._escape_text(block.get("title") or "图表", for_table=True)
+        if isinstance(block.get("blocks"), list):
+            return self._render_blocks_as_text(block.get("blocks"))
+        return self._escape_text(str(block), for_table=True)
+
+    def _markdown_row(self, cells: List[str]) -> str:
+        return "| " + " | ".join(cells) + " |"
+
+    def _markdown_separator(self, count: int) -> str:
+        return "| " + " | ".join(["---"] * max(1, count)) + " |"
+
+    def _render_inlines(self, inlines: List[Any], for_table: bool = False) -> str:
+        parts: List[str] = []
+        for run in inlines or []:
+            parts.append(self._render_inline_run(run, for_table=for_table))
+        return "".join(parts)
+
+    def _render_inline_run(self, run: Any, for_table: bool = False) -> str:
+        if isinstance(run, dict):
+            text = run.get("text", "")
+            marks = run.get("marks") or []
+        else:
+            text = run if isinstance(run, str) else ""
+            marks = []
+        result = self._escape_text(text, for_table=for_table)
+        for mark in marks:
+            if not isinstance(mark, dict):
+                continue
+            mtype = mark.get("type")
+            if mtype == "bold":
+                result = f"**{result}**"
+            elif mtype == "italic":
+                result = f"*{result}*"
+            elif mtype == "underline":
+                result = f"__{result}__"
+            elif mtype == "strike":
+                result = f"~~{result}~~"
+            elif mtype == "code":
+                result = f"`{result}`"
+            elif mtype == "link":
+                href = mark.get("href") or mark.get("value")
+                href = str(href) if href else ""
+                result = f"[{result}]({href})" if href else result
+            elif mtype == "highlight":
+                result = f"=={result}=="
+            elif mtype == "subscript":
+                result = f"~{result}~"
+            elif mtype == "superscript":
+                result = f"^{result}^"
+            elif mtype == "math":
+                latex = self._normalize_math(mark.get("value") or text)
+                result = f"${latex}$" if latex else result
+            # 颜色/字体等非通用标记直接降级为纯文本
+        return result
+
+    def _quote_lines(self, text: str) -> str:
+        if not text:
+            return ""
+        lines = []
+        for line in text.splitlines():
+            line = line.strip()
+            prefix = "> " if line else ">"
+            lines.append(f"{prefix}{line}")
+        return "\n".join(lines)
+
+    def _normalize_swot_items(self, raw: Any) -> List[Dict[str, Any]]:
+        items: List[Dict[str, Any]] = []
+        if not raw:
+            return items
+        for entry in raw:
+            if isinstance(entry, str):
+                items.append({"title": entry})
+            elif isinstance(entry, dict):
+                title = entry.get("title") or entry.get("label") or entry.get("text")
+                detail = entry.get("detail") or entry.get("description")
+                impact = entry.get("impact")
+                priority = entry.get("priority")
+                evidence = entry.get("evidence")
+                items.append({
+                    "title": title or "未命名要点",
+                    "detail": detail,
+                    "impact": impact,
+                    "priority": priority,
+                    "evidence": evidence,
+                })
+        return items
+
+    def _normalize_pest_items(self, raw: Any) -> List[Dict[str, Any]]:
+        items: List[Dict[str, Any]] = []
+        if not raw:
+            return items
+        for entry in raw:
+            if isinstance(entry, str):
+                items.append({"title": entry})
+            elif isinstance(entry, dict):
+                title = entry.get("title") or entry.get("label") or entry.get("text")
+                detail = entry.get("detail") or entry.get("description")
+                items.append({
+                    "title": title or "未命名要点",
+                    "detail": detail,
+                    "impact": entry.get("impact"),
+                    "priority": entry.get("priority"),
+                    "weight": entry.get("weight"),
+                })
+        return items
+
+    def _coerce_chart_data(self, data: Dict[str, Any]) -> Dict[str, Any]:
+        if not isinstance(data, dict):
+            return {}
+        if "labels" in data or "datasets" in data:
+            return data
+        for key in ("data", "chartData", "payload"):
+            nested = data.get(key)
+            if isinstance(nested, dict) and ("labels" in nested or "datasets" in nested):
+                return nested
+        return data
+
+    def _collect_wordcloud_items(self, block: Dict[str, Any]) -> List[Dict[str, Any]]:
+        props = block.get("props") or {}
+        candidates: List[Any] = []
+        for key in ("data", "words", "items"):
+            value = props.get(key)
+            if isinstance(value, list):
+                candidates.append(value)
+        data_field = block.get("data")
+        if isinstance(data_field, list):
+            candidates.append(data_field)
+        elif isinstance(data_field, dict):
+            if isinstance(data_field.get("items"), list):
+                candidates.append(data_field.get("items"))
+
+        items: List[Dict[str, Any]] = []
+        seen: set[str] = set()
+
+        def push(word: str, weight: Any, category: str) -> None:
+            key = f"{word}::{category}"
+            if key in seen:
+                return
+            seen.add(key)
+            items.append({"word": word, "weight": weight, "category": category})
+
+        for candidate in candidates:
+            for entry in candidate or []:
+                if isinstance(entry, dict):
+                    word = entry.get("word") or entry.get("text") or entry.get("label")
+                    if not word:
+                        continue
+                    weight = entry.get("weight") or entry.get("value")
+                    category = entry.get("category") or ""
+                    push(str(word), weight, str(category))
+                elif isinstance(entry, (list, tuple)) and entry:
+                    word = entry[0]
+                    weight = entry[1] if len(entry) > 1 else ""
+                    category = entry[2] if len(entry) > 2 else ""
+                    push(str(word), weight, str(category))
+                elif isinstance(entry, str):
+                    push(entry, "", "")
+        return items
+
+    def _escape_text(self, text: Any, for_table: bool = False) -> str:
+        if text is None:
+            return ""
+        value = str(text)
+        if for_table:
+            value = value.replace("|", r"\|").replace("\n", " ").replace("\r", " ")
+        return value.strip()
+
+    def _stringify_value(self, value: Any) -> str:
+        if value is None:
+            return ""
+        if isinstance(value, (int, float)) and not isinstance(value, bool):
+            return str(value)
+        if isinstance(value, dict):
+            # 优先取常见数值字段
+            for key in ("y", "value"):
+                if key in value:
+                    return str(value[key])
+            try:
+                return json.dumps(value, ensure_ascii=False)
+            except Exception:
+                return str(value)
+        if isinstance(value, list):
+            return ", ".join(self._stringify_value(v) for v in value)
+        return str(value)
+
+    def _normalize_math(self, raw: Any) -> str:
+        if not isinstance(raw, str):
+            return ""
+        text = raw.strip()
+        patterns = [
+            ("$$", "$$"),
+            ("\\[", "\\]"),
+            ("\\(", "\\)"),
+        ]
+        for start, end in patterns:
+            if text.startswith(start) and text.endswith(end):
+                return text[len(start) : -len(end)].strip()
+        return text
+
+    def _format_delta(self, delta: Any, tone: Any) -> str:
+        if delta is None:
+            return ""
+        prefix = ""
+        tone_val = (tone or "").lower()
+        if tone_val in ("up", "increase", "positive"):
+            prefix = "▲ "
+        elif tone_val in ("down", "decrease", "negative"):
+            prefix = "▼ "
+        return f"{prefix}{delta}"
+
+    def _fallback_unknown(self, block: Dict[str, Any]) -> str:
+        try:
+            payload = json.dumps(block, ensure_ascii=False, indent=2)
+        except Exception:
+            payload = str(block)
+        logger.debug(f"未识别的区块类型，使用JSON兜底: {block}")
+        return f"```json\n{payload}\n```"
+
+
+__all__ = ["MarkdownRenderer"]
--- a/ReportEngine/renderers/pdf_renderer.py
View file @997a328
+++ b/ReportEngine/renderers/pdf_renderer.py
View file @997a328
@@ -71,6 +71,7 @@ from .html_renderer import HTMLRenderer
 from .pdf_layout_optimizer import PDFLayoutOptimizer, PDFLayoutConfig
 from .chart_to_svg import create_chart_converter
 from .math_to_svg import MathToSVG
+from .markdown_renderer import MarkdownRenderer
 try:
     from wordcloud import WordCloud
     WORDCLOUD_AVAILABLE = True
@@ -102,6 +103,7 @@ class PDFRenderer:
         """
         self.config = config or {}
         self.html_renderer = HTMLRenderer(config)
+        self.markdown_renderer = MarkdownRenderer()
         self.layout_optimizer = layout_optimizer or PDFLayoutOptimizer()
         if not WEASYPRINT_AVAILABLE:
@@ -886,6 +888,36 @@ class PDFRenderer:
         return html
+    def _build_markdown_filename(self, document_ir: Dict[str, Any]) -> str:
+        """根据元数据生成Markdown文件名"""
+        metadata = document_ir.get("metadata") or {}
+        title = metadata.get("title") or metadata.get("query") or metadata.get("reportId") or "report"
+        safe = "".join(ch for ch in str(title) if ch.isalnum() or ch in (" ", "-", "_")).strip()
+        safe = safe.replace(" ", "_")[:80] or "report"
+        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+        return f"{safe}_{timestamp}.md"
+
+    def _export_markdown(self, document_ir: Dict[str, Any]) -> None:
+        """
+        使用检查/修复后的IR生成Markdown版本。
+
+        - 图表/词云等交互组件降级为原始表格数据；
+        - 遇到异常时仅记录警告，不阻断PDF/HTML流程。
+        """
+        try:
+            markdown_content = self.markdown_renderer.render(document_ir)
+            if not markdown_content.strip():
+                logger.debug("Markdown渲染结果为空，跳过落盘")
+                return
+
+            output_dir = Path("final_reports/markdown")
+            output_dir.mkdir(parents=True, exist_ok=True)
+            file_path = output_dir / self._build_markdown_filename(document_ir)
+            file_path.write_text(markdown_content, encoding="utf-8")
+            logger.info(f"已静默生成Markdown报告: {file_path}")
+        except Exception as exc:
+            logger.warning(f"生成Markdown报告失败（已忽略，不影响PDF/HTML）: {exc}")
+
     def _get_pdf_html(
         self,
         document_ir: Dict[str, Any],
@@ -943,6 +975,9 @@ class PDFRenderer:
         logger.info("开始转换数学公式为SVG矢量图形...")
         math_svg_map = self._convert_math_to_svg(preprocessed_ir)
+        # 在渲染HTML前静默导出Markdown版本
+        self._export_markdown(preprocessed_ir)
+
         # 使用HTML渲染器生成基础HTML（使用预处理后的IR，以便复用mathId等标记）
         html = self.html_renderer.render(preprocessed_ir)