AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning

We introduce AtomR, a framework for LLMs to conduct accurate heterogeneous knowledge reasoning at the atomic level. Inspired by how knowledge graph query languages model compositional reasoning through combining predefined operations, we propose three atomic knowledge operators, a unified set of operators for LLMs to retrieve and manipulate knowledge from heterogeneous sources. First, in the reasoning planning stage, AtomR decomposes a complex question into a reasoning tree where each leaf node corresponds to an atomic knowledge operator, achieving question decomposition that is highly fine-grained and orthogonal. Subsequently, in the reasoning execution stage, AtomR executes each atomic knowledge operator, which flexibly selects, retrieves, and operates atomic level knowledge from heterogeneous sources. We also introduce BlendQA, a challenging benchmark specially tailored for heterogeneous knowledge reasoning. Experiments on three single-source and two multi-source datasets show that AtomR outperforms state-of-the-art baselines by a large margin, with F1 score improvements of 9.4% on 2WikiMultihop and 9.5% on BlendQA.

📖 Paper: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning
📊 BlendQA dataset on 🤗HuggingFace: BlendQA

Setup Text Retriever via ColBERT

To evaluate AtomR on HotpotQA, download the Wikipedia abstract dump provided by HotpotQA:

wget https://nlp.stanford.edu/projects/hotpotqa/enwiki-20171001-pages-meta-current-withlinks-abstracts.tar.bz2 {YOUR_DIRECTORY}

To evaluate AtomR on 2WikiMultiHop, Musique, BlendQA, and CRAG, download the full December 2021 Wikipedia dump provided by Atlas. Follow Atlas's Corpora download instructions to download the corpus enwiki-dec2021.
Format the downloaded corpora into ColBERT format:

cd ColBERT
python format_tsv_hotpotqa.py
python format_tsv_atlas.py

Download the ColBERTv2 model:

mkdir model_checkpoints
cd model_checkpoints
wget https://downloads.cs.stanford.edu/nlp/data/colbert/colbertv2/colbertv2.0.tar.gz

Index your data

cd ..
python index_hotpotqa.py
python index_atlas.py

Setup text retrieval service via Flask

python setup_service_hotpotqa.py
python setup_service_atlas.py

Setup OpenAI service

cd ../openai_service
python openai_service.py

Run Experiments

cd ../src

Run main.py and adjust the code accordingly:

Single-source Datasets

HotpotQA

dataset_name = "HotpotQA"
dataset_path = "../datasets/single-source/HotpotQA/hotpotqa_test_500.jsonl"
output_trees_path = "../results/hotpotqa_test_500_trees.jsonl"
output_predictions_path = "../results/hotpotqa_test_500_predictions.jsonl"
text_retriever_url = "http://localhost:1212/api/search"  # HotpotQA wiki dump
evaluate_dataset_single_source(dataset_name=dataset_name, dataset_path=dataset_path, output_trees_path=output_trees_path, output_predictions_path=output_predictions_path, text_retriever_url=text_retriever_url)

2WikiMultiHop

dataset_name = "2WikiMultiHop"
dataset_path = "../datasets/single-source/2WikiMultiHop/2wiki_test_500.jsonl"
output_trees_path = "../results/2wiki_test_500_trees.jsonl"
output_predictions_path = "../results/2wiki_test_500_predictions.jsonl"
text_retriever_url = "http://localhost:1214/api/search"  # Atlas wiki dump
evaluate_dataset_single_source(dataset_name=dataset_name, dataset_path=dataset_path, output_trees_path=output_trees_path, output_predictions_path=output_predictions_path, text_retriever_url=text_retriever_url)

Musique

dataset_name = "Musique"
dataset_path = "../datasets/single-source/Musique/musique_test_500.jsonl"
output_trees_path = "../results/musique_test_500_trees.jsonl"
output_predictions_path = "../results/musique_test_500_predictions.jsonl"
text_retriever_url = "http://localhost:1214/api/search"  # Atlas wiki dump
evaluate_dataset_single_source(dataset_name=dataset_name, dataset_path=dataset_path, output_trees_path=output_trees_path, output_predictions_path=output_predictions_path, text_retriever_url=text_retriever_url)

Multi-source Datasets

You need to have a Google SERPAPI key to access Google.

BlendQA (i.e., KG-Web)

dataset_name = "BlendQA"
dataset_path = "../datasets/multi_source/BlendQA/kg-web_132.jsonl"
output_trees_path = "../results/blendqa_kg-web_132_trees.jsonl"
output_predictions_path = "../results/blendqa_kg-web_132_predictions.jsonl"
text_retriever_url = "http://localhost:1214/api/search"  # Atlas wiki dump
google_serpapi_key = "YOUR_SERPAPI_KEY"  # TODO: put your SERPAPI key
evaluate_dataset_multi_source(dataset_name=dataset_name, dataset_path=dataset_path, output_trees_path=output_trees_path, output_predictions_path=output_predictions_path, text_retriever_url=text_retriever_url)

CRAG

dataset_name = "CRAG"
dataset_path = "../datasets/multi_source/CRAG/CRAG_test_500.jsonl"
output_trees_path = "../results/crag_test_500_trees.jsonl"
output_predictions_path = "../results/crag_test_500_predictions.jsonl"
text_retriever_url = "http://localhost:1214/api/search"  # Atlas wiki dump
google_serpapi_key = "YOUR_SERPAPI_KEY"  # TODO: put your SERPAPI key
evaluate_dataset_multi_source(dataset_name=dataset_name, dataset_path=dataset_path, output_trees_path=output_trees_path, output_predictions_path=output_predictions_path, text_retriever_url=text_retriever_url)

Released Trees and Predictions

We release the Atomic Reasoning Trees (ARTs) and final predictions of our main experiments under ../results/released.

Metric Calculation (F1)

python calculate_metrics.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning

Setup Text Retriever via ColBERT

Setup OpenAI service

Run Experiments

Single-source Datasets

Multi-source Datasets

Released Trees and Predictions

Metric Calculation (F1)

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
ColBERT		ColBERT
datasets		datasets
figures		figures
openai_service		openai_service
results/released		results/released
src		src
README.md		README.md

THU-KEG/AtomR

Folders and files

Latest commit

History

Repository files navigation

AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning

Setup Text Retriever via ColBERT

Setup OpenAI service

Run Experiments

Single-source Datasets

Multi-source Datasets

Released Trees and Predictions

Metric Calculation (F1)

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages