First draft for SheetReader extension #1

freddie-freeloader · 2024-10-03T14:14:40Z

Hi!

In the last semester, I was part of a programming project organized by the DIMA group at TU Berlin. We created a small DuckDB-extension named sheetreader that utilizes sheetreader-core (a fast multi-threaded XLSX parser) for importing XLSX files into DuckDB.

We did a few benchmarks comparing our extension to the import function which the spatial extension provides (st_read). Our first benchmarks indicate, that depending on several factors the sheetreader extension is around 5 to 10 times faster than the spatial extension at parsing XLSX files and loading them into DuckDB (https://github.com/polydbms/sheetreader-duckdb/?tab=readme-ov-file#benchmarks).

We would like to offer this extension as a DuckDB community extension.

A note regarding the repository structure of our extension:

We have a version in branch benchmark-version that has code dedicated for benchmarking.
On the branch main, we provide a “slimmed down” version with that code removed. We would like to offer the latter version as the community extension.

extensions/sheetreader/description.yml

harrygav reviewed Oct 3, 2024

View reviewed changes

extensions/sheetreader/description.yml Outdated Show resolved Hide resolved

harrygav reviewed Oct 3, 2024

View reviewed changes

extensions/sheetreader/description.yml Outdated Show resolved Hide resolved

freddie-freeloader force-pushed the add-sheetreader-extension branch 3 times, most recently from 4d7e446 to 7070d94 Compare October 4, 2024 17:37

Add sheetreader as community extension

34f553e

freddie-freeloader force-pushed the add-sheetreader-extension branch from 7070d94 to 34f553e Compare October 8, 2024 07:35

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

First draft for SheetReader extension #1

First draft for SheetReader extension #1

freddie-freeloader commented Oct 3, 2024 •

edited

Loading

First draft for SheetReader extension #1

Are you sure you want to change the base?

First draft for SheetReader extension #1

Conversation

freddie-freeloader commented Oct 3, 2024 • edited Loading

freddie-freeloader commented Oct 3, 2024 •

edited

Loading