Implement `mode == "overwrite"` in `to_deltalake`

The first version of writing into deltalake did not implement overwriting an existing table. Currently, this is raising a `ValueError` (should actually raise a `NotImplementedError`):

```python
import pandas as pd
import numpy as np
import dask.dataframe as dd
from dask_deltatable.write import to_deltalake


if __name__ == "__main__":
    df = pd.DataFrame({
        "i1": np.random.randint(1, 10000, size=100),
        "f1": np.random.random(100),
        "s1": np.random.choice(["Apple", "Banana", "Watermelon", "Mango"], size=100),
    })
    ddf = dd.from_pandas(df, npartitions=10)
    to_deltalake("t1_data", ddf, mode="overwrite").compute()
```

Raises:

```
Traceback (most recent call last):
  File "/Users/jbennet/src/dask-deltatable/t1.py", line 14, in <module>
    to_deltalake("t1_data", ddf, mode="overwrite").compute()
  File "/Users/jbennet/src/dask-deltatable/dask_deltatable/write.py", line 82, in to_deltalake
    raise ValueError(
ValueError: Schema of data does not match table schema
Table schema:
None
Data Schema:
i1: int64
f1: double
s1: string
```

Original PR: https://github.com/dask-contrib/dask-deltatable/pull/29.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Implement `mode == "overwrite"` in `to_deltalake` #34

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Implement mode == "overwrite" in to_deltalake #34

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

Implement `mode == "overwrite"` in `to_deltalake` #34