首页 › 2025年 › 11月 › Heretic 中电路发现与针对性消融:实现多轮 LLM 对话的无审查响应
2025年11月17日 ai-systems

Heretic 中电路发现与针对性消融:实现多轮 LLM 对话的无审查响应

利用 Heretic 工具,通过电路发现和针对性 abliteration,在多轮 LLM 对话中维持无审查响应,避免重复干预,提供工程参数和监控要点。

内容加载中...