Panduan Pengguna ThesisAgents
Asisten pencarian makalah berbasis kata kunci. Mengambil hasil dari arXiv, Semantic Scholar, OpenAlex, PubMed, ACM, IEEE Xplore, DBLP, Crossref, OpenAIRE, Springer Nature, Europe PMC, DOAJ, HAL, CORE, dan Google Scholar; dan mengekspor sebagai presentasi PowerPoint gaya tesis, buku kerja Excel, dan berkas BibTeX. Semua dari satu panggilan CLI atau satu panggilan tool MCP.
Untuk agen AI yang menjalankan proyek ini
Jika Anda LLM (Claude Code, Cursor, Aider, Codex CLI, …) yang membaca
dokumen ini untuk tahu apa yang harus dilakukan — mulailah di sini.
Aturan yang sama disematkan di AGENTS.md (cermin lintas-agen) dan
CLAUDE.md (referensi resmi) di akar repo; baca itu sebelum
perubahan non-sepele.
Deliverable default adalah satu ``.pptx`` gaya tesis yang diperkaya per makalah, bukan deck ringan hanya-abstrak yang dihasilkan CLI secara default. Output ringan adalah artefak antara — tugas Anda adalah meningkatkannya.
Pohon keputusan
ANTHROPIC_API_KEYdi-set? → jalankan CLI; otomatis memperkaya via API Anthropic.Tanpa key, LLM menjalankan → tulis ringkasan diperkaya sendiri. Baca tiap PDF, tulis tangan
PaperSummarydengan field rich-tier, letakkanscripts/regen_<query>.py, jalankan. Jangan suruh pengguna men-set API key — Andalah LLM-nya.Tanpa LLM (CI / cron) → ringan dapat diterima.
Alur MCP 6 langkah
1. (opsional) list_sources()
2. search(keywords, sources, top_tier_only=true, ...)
3. (opsional) download_pdfs(papers, out_dir="./exports/...")
4. fetch_pdf_text(pdf_url=paper.pdf_url) # per makalah
5. (Anda membaca tiap PDF dan menghasilkan dict ringkasan terstruktur)
6. export(papers=[{...paper, "summary": {...}}], language="id", ...)
12 tool MCP lengkap: MCP server.
Wajib: verifikasi URL / DOI sebelum penyerahan
Jalur URL penerbit tidak dapat ditebak — AAAI memakai ID numerik
(v40i5.37389), IEEE memakai arnumber opak, ACM memakai DOI
opak. Saat menulis tangan Paper, salin ``url`` / ``doi`` /
``arxiv_id`` apa adanya dari xlsx yang dihasilkan pencarian ini —
jangan pernah dari ingatan, jangan disusun dari judul.
xlsx ditulis ke exports/<run>/<slug>-<timestamp>.xlsx dengan kolom
7 = DOI, kolom 8 = URL. Audit script regen Anda saat selesai:
from openpyxl import load_workbook
from scripts.regen_<run> import ALL_PAPERS
real = {sh.cell(row=r, column=2).value: sh.cell(row=r, column=8).value
for sh in [load_workbook("exports/<run>/<slug>-<ts>.xlsx")["Papers"]]
for r in range(2, sh.max_row + 1)}
for p in ALL_PAPERS:
actual = next((u for t, u in real.items() if p.title[:30] in (t or "")), None)
if actual and not (p.url == actual
or p.url.split("v")[0] == actual.split("v")[0]):
print(f"! {p.bibtex_key()} authored {p.url} vs real {actual}")
Larangan
Jangan suruh pengguna “set
ANTHROPIC_API_KEY” — Anda LLM-nya.Jangan perlakukan
.pptxringan sebagai deliverable.Jangan berhenti saat
download_pdfsselesai.Jangan mengarang angka, RQ, kontribusi, keterbatasan.
Jangan memfabrikasi URLs / DOIs / arXiv IDs.
Jangan tinggalkan unduhan tidak relevan di direktori run. Pencarian kata kunci kadang membawa makalah tidak terkait (kueri “Claude code” membawa makalah tentang decoder Viterbi). Hapus
pdfs/<key>.pdfdan<key>.pptxringan yang tidak relevan; pertahankan xlsx / bib agregat sebagai catatan jujur. Prosedur lengkap diCLAUDE.md“Pruning irrelevant downloads”.Jangan menyebut “Claude”, “Claude Code”, “AI-generated”, “GPT”, “Copilot”, atau nama tool/model AI lain di commit, PR, kode, atau dokumentasi.
Contoh: scripts/regen_llm_security_batch.py (en, 8 makalah) dan
scripts/regen_llm_security_batch_zh_tw.py (zh-tw).
Instalasi
Perlu Python 3.12+.
git clone <repo-url>
cd ThesisAgents
python -m venv .venv
.venv\Scripts\Activate.ps1 # Windows PowerShell
# source .venv/bin/activate # Linux / macOS
pip install -e .[dev]
Extras opsional: [mcp], [intelligence], [web], [dev].
Mulai cepat
# Cari arXiv → deck + workbook + BibTeX
thesisagents --query "diffusion models" --source arxiv --max 10 \
--out ./exports/
# Satu makalah by URL → deck + BibTeX
thesisagents --paper "https://arxiv.org/abs/1706.03762" \
--filename-stem attention --out ./exports/
# Render deck dalam Bahasa Indonesia
thesisagents --paper 1706.03762 --lang id --out ./exports/
# Pengayaan Python pipeline (butuh key Anthropic)
export ANTHROPIC_API_KEY=sk-ant-...
thesisagents --paper "https://arxiv.org/abs/1706.03762" \
--enrich --lang id --out ./exports/
Tabel flag CLI lengkap: CLI reference.
Bacaan lebih lanjut
Flag CLI dan variabel lingkungan: CLI reference
12 tool server MCP: MCP server
Toolkit edit PPTX: PPTX editing & layout
Berkas
readmes/README.id.mddi akar repo berisi daftar fitur lengkap.Referensi teknis mendalam (arsitektur plugin, kebijakan keamanan, Definition of Done, aturan SonarQube, …) terkonsolidasi di panduan Inggris: ThesisAgents User Guide.