From b44757e3ee8f3cb3ae6f5de66b937ed8e80d06b3 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Thu, 9 Oct 2025 20:58:53 -0700
Subject: [PATCH 01/11] Add clustered and fanout writer

---
 .../writer/base_writer/data_file_writer.rs    |  26 +-
 .../base_writer/equality_delete_writer.rs     |  42 +-
 crates/iceberg/src/writer/mod.rs              |  34 +-
 .../partitioning/clustered_data_writer.rs     | 600 ++++++++++++++++
 .../writer/partitioning/fanout_data_writer.rs | 676 ++++++++++++++++++
 crates/iceberg/src/writer/partitioning/mod.rs |  49 ++
 .../datafusion/src/physical_plan/write.rs     |   7 +-
 7 files changed, 1378 insertions(+), 56 deletions(-)
 create mode 100644 crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
 create mode 100644 crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
 create mode 100644 crates/iceberg/src/writer/partitioning/mod.rs
diff --git a/crates/iceberg/src/writer/base_writer/data_file_writer.rs b/crates/iceberg/src/writer/base_writer/data_file_writer.rs
index a950547d3..5de93f98f 100644
--- a/crates/iceberg/src/writer/base_writer/data_file_writer.rs
+++ b/crates/iceberg/src/writer/base_writer/data_file_writer.rs
@@ -30,7 +30,6 @@ use crate::{Error, ErrorKind, Result};
 #[derive(Clone, Debug)]
 pub struct DataFileWriterBuilder<B: FileWriterBuilder, L: LocationGenerator, F: FileNameGenerator> {
     inner: RollingFileWriterBuilder<B, L, F>,
-    partition_key: Option<PartitionKey>,
 }
 
 impl<B, L, F> DataFileWriterBuilder<B, L, F>
@@ -40,14 +39,8 @@ where
     F: FileNameGenerator,
 {
     /// Create a new `DataFileWriterBuilder` using a `RollingFileWriterBuilder`.
-    pub fn new(
-        inner_builder: RollingFileWriterBuilder<B, L, F>,
-        partition_key: Option<PartitionKey>,
-    ) -> Self {
-        Self {
-            inner: inner_builder,
-            partition_key,
-        }
+    pub fn new(inner: RollingFileWriterBuilder<B, L, F>) -> Self {
+        Self { inner }
     }
 }
 
@@ -60,10 +53,10 @@ where
 {
     type R = DataFileWriter<B, L, F>;
 
-    async fn build(self) -> Result<Self::R> {
+    async fn build_with_partition(self, partition_key: Option<PartitionKey>) -> Result<Self::R> {
         Ok(DataFileWriter {
             inner: Some(self.inner.clone().build()),
-            partition_key: self.partition_key,
+            partition_key,
         })
     }
 }
@@ -194,8 +187,8 @@ mod test {
             file_name_gen,
         );
 
-        let mut data_file_writer = DataFileWriterBuilder::new(rolling_file_writer_builder, None)
-            .build()
+        let mut data_file_writer = DataFileWriterBuilder::new(rolling_file_writer_builder)
+            .build_with_partition(None)
             .await
             .unwrap();
 
@@ -280,10 +273,9 @@ mod test {
             file_name_gen,
         );
 
-        let mut data_file_writer =
-            DataFileWriterBuilder::new(rolling_file_writer_builder, Some(partition_key))
-                .build()
-                .await?;
+        let mut data_file_writer = DataFileWriterBuilder::new(rolling_file_writer_builder)
+            .build_with_partition(Some(partition_key))
+            .await?;
 
         let arrow_schema = arrow_schema::Schema::new(vec![
             Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
diff --git a/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs b/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs
index 6740ed435..1d3bcc7db 100644
--- a/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs
+++ b/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs
@@ -66,16 +66,11 @@ pub struct EqualityDeleteWriterConfig {
     equality_ids: Vec<i32>,
     // Projector used to project the data chunk into specific fields.
     projector: RecordBatchProjector,
-    partition_key: Option<PartitionKey>,
 }
 
 impl EqualityDeleteWriterConfig {
     /// Create a new `DataFileWriterConfig` with equality ids.
-    pub fn new(
-        equality_ids: Vec<i32>,
-        original_schema: SchemaRef,
-        partition_key: Option<PartitionKey>,
-    ) -> Result<Self> {
+    pub fn new(equality_ids: Vec<i32>, original_schema: SchemaRef) -> Result<Self> {
         let original_arrow_schema = Arc::new(schema_to_arrow_schema(&original_schema)?);
         let projector = RecordBatchProjector::new(
             original_arrow_schema,
@@ -110,7 +105,6 @@ impl EqualityDeleteWriterConfig {
         Ok(Self {
             equality_ids,
             projector,
-            partition_key,
         })
     }
 
@@ -129,12 +123,12 @@ where
 {
     type R = EqualityDeleteFileWriter<B, L, F>;
 
-    async fn build(self) -> Result<Self::R> {
+    async fn build_with_partition(self, partition_key: Option<PartitionKey>) -> Result<Self::R> {
         Ok(EqualityDeleteFileWriter {
-            inner: Some(self.inner.clone().build()), // todo revisit this, probably still need a builder for rolling writer
+            inner: Some(self.inner.clone().build()),
             projector: self.config.projector,
             equality_ids: self.config.equality_ids,
-            partition_key: self.config.partition_key,
+            partition_key,
         })
     }
 }
@@ -428,7 +422,7 @@ mod test {
 
         let equality_ids = vec![0_i32, 8];
         let equality_config =
-            EqualityDeleteWriterConfig::new(equality_ids, Arc::new(schema), None).unwrap();
+            EqualityDeleteWriterConfig::new(equality_ids, Arc::new(schema)).unwrap();
         let delete_schema =
             arrow_schema_to_schema(equality_config.projected_arrow_schema_ref()).unwrap();
         let projector = equality_config.projector.clone();
@@ -444,7 +438,7 @@ mod test {
         );
         let mut equality_delete_writer =
             EqualityDeleteFileWriterBuilder::new(rolling_writer_builder, equality_config)
-                .build()
+                .build_with_partition(None)
                 .await?;
 
         // write
@@ -531,19 +525,19 @@ mod test {
                 .unwrap(),
         );
         // Float and Double are not allowed to be used for equality delete
-        assert!(EqualityDeleteWriterConfig::new(vec![0], schema.clone(), None).is_err());
-        assert!(EqualityDeleteWriterConfig::new(vec![1], schema.clone(), None).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![0], schema.clone()).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![1], schema.clone()).is_err());
         // Struct is not allowed to be used for equality delete
-        assert!(EqualityDeleteWriterConfig::new(vec![3], schema.clone(), None).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![3], schema.clone()).is_err());
         // Nested field of struct is allowed to be used for equality delete
-        assert!(EqualityDeleteWriterConfig::new(vec![4], schema.clone(), None).is_ok());
+        assert!(EqualityDeleteWriterConfig::new(vec![4], schema.clone()).is_ok());
         // Nested field of map is not allowed to be used for equality delete
-        assert!(EqualityDeleteWriterConfig::new(vec![7], schema.clone(), None).is_err());
-        assert!(EqualityDeleteWriterConfig::new(vec![8], schema.clone(), None).is_err());
-        assert!(EqualityDeleteWriterConfig::new(vec![9], schema.clone(), None).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![7], schema.clone()).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![8], schema.clone()).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![9], schema.clone()).is_err());
         // Nested field of list is not allowed to be used for equality delete
-        assert!(EqualityDeleteWriterConfig::new(vec![10], schema.clone(), None).is_err());
-        assert!(EqualityDeleteWriterConfig::new(vec![11], schema.clone(), None).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![10], schema.clone()).is_err());
+        assert!(EqualityDeleteWriterConfig::new(vec![11], schema.clone()).is_err());
 
         Ok(())
     }
@@ -597,7 +591,7 @@ mod test {
                 .unwrap(),
         );
         let equality_ids = vec![0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13];
-        let config = EqualityDeleteWriterConfig::new(equality_ids, schema.clone(), None).unwrap();
+        let config = EqualityDeleteWriterConfig::new(equality_ids, schema.clone()).unwrap();
         let delete_arrow_schema = config.projected_arrow_schema_ref().clone();
         let delete_schema = arrow_schema_to_schema(&delete_arrow_schema).unwrap();
 
@@ -611,7 +605,7 @@ mod test {
         );
         let mut equality_delete_writer =
             EqualityDeleteFileWriterBuilder::new(rolling_writer_builder, config)
-                .build()
+                .build_with_partition(None)
                 .await?;
 
         // prepare data
@@ -795,7 +789,7 @@ mod test {
         let to_write = RecordBatch::try_new(arrow_schema.clone(), columns).unwrap();
         let equality_ids = vec![0_i32, 2, 5];
         let equality_config =
-            EqualityDeleteWriterConfig::new(equality_ids, Arc::new(schema), None).unwrap();
+            EqualityDeleteWriterConfig::new(equality_ids, Arc::new(schema)).unwrap();
         let projector = equality_config.projector.clone();
 
         // check
diff --git a/crates/iceberg/src/writer/mod.rs b/crates/iceberg/src/writer/mod.rs
index d5a8a6686..1427fcac7 100644
--- a/crates/iceberg/src/writer/mod.rs
+++ b/crates/iceberg/src/writer/mod.rs
@@ -100,10 +100,9 @@
 //!     );
 //!
 //!     // Create a data file writer using parquet file writer builder.
-//!     let data_file_writer_builder =
-//!         DataFileWriterBuilder::new(rolling_file_writer_builder, None);
+//!     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
 //!     // Build the data file writer
-//!     let mut data_file_writer = data_file_writer_builder.build().await?;
+//!     let mut data_file_writer = data_file_writer_builder.build_with_partition(None).await?;
 //!
 //!     // Write the data using data_file_writer...
 //!
@@ -122,7 +121,7 @@
 //! use arrow_array::RecordBatch;
 //! use iceberg::io::FileIOBuilder;
 //! use iceberg::memory::MemoryCatalogBuilder;
-//! use iceberg::spec::DataFile;
+//! use iceberg::spec::{DataFile, PartitionKey};
 //! use iceberg::writer::base_writer::data_file_writer::DataFileWriterBuilder;
 //! use iceberg::writer::file_writer::ParquetWriterBuilder;
 //! use iceberg::writer::file_writer::location_generator::{
@@ -149,9 +148,15 @@
 //! impl<B: IcebergWriterBuilder> IcebergWriterBuilder for LatencyRecordWriterBuilder<B> {
 //!     type R = LatencyRecordWriter<B::R>;
 //!
-//!     async fn build(self) -> Result<Self::R> {
+//!     async fn build_with_partition(
+//!         self,
+//!         partition_key: Option<PartitionKey>,
+//!     ) -> Result<Self::R> {
 //!         Ok(LatencyRecordWriter {
-//!             inner_writer: self.inner_writer_builder.build().await?,
+//!             inner_writer: self
+//!                 .inner_writer_builder
+//!                 .build_with_partition(partition_key)
+//!                 .await?,
 //!         })
 //!     }
 //! }
@@ -231,12 +236,14 @@
 //!     );
 //!
 //!     // Create a data file writer builder using rolling file writer.
-//!     let data_file_writer_builder =
-//!         DataFileWriterBuilder::new(rolling_file_writer_builder, Some(partition_key));
+//!     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
 //!     // Create latency record writer using data file writer builder.
 //!     let latency_record_builder = LatencyRecordWriterBuilder::new(data_file_writer_builder);
 //!     // Build the final writer
-//!     let mut latency_record_data_file_writer = latency_record_builder.build().await.unwrap();
+//!     let mut latency_record_data_file_writer = latency_record_builder
+//!         .build_with_partition(Some(partition_key))
+//!         .await
+//!         .unwrap();
 //!
 //!     Ok(())
 //! }
@@ -244,11 +251,14 @@
 
 pub mod base_writer;
 pub mod file_writer;
+/// Provides partition-aware writers
+/// TODO examples
+pub mod partitioning;
 
 use arrow_array::RecordBatch;
 
 use crate::Result;
-use crate::spec::DataFile;
+use crate::spec::{DataFile, PartitionKey};
 
 type DefaultInput = RecordBatch;
 type DefaultOutput = Vec<DataFile>;
@@ -260,8 +270,8 @@ pub trait IcebergWriterBuilder<I = DefaultInput, O = DefaultOutput>:
 {
     /// The associated writer type.
     type R: IcebergWriter<I, O>;
-    /// Build the iceberg writer.
-    async fn build(self) -> Result<Self::R>;
+    /// Build the iceberg writer for an optional partition key.
+    async fn build_with_partition(self, partition_key: Option<PartitionKey>) -> Result<Self::R>;
 }
 
 /// The iceberg writer used to write data to iceberg table.
diff --git a/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs b/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
new file mode 100644
index 000000000..f8f458d74
--- /dev/null
+++ b/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
@@ -0,0 +1,600 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+//! This module provides the `ClusteredDataWriter` implementation.
+
+use std::collections::HashSet;
+
+use arrow_array::RecordBatch;
+use async_trait::async_trait;
+
+use crate::spec::{DataFile, PartitionKey, Struct};
+use crate::writer::partitioning::PartitioningWriter;
+use crate::writer::{IcebergWriter, IcebergWriterBuilder};
+use crate::{Error, ErrorKind, Result};
+
+/// A writer that writes data to a single partition at a time.
+#[derive(Clone)]
+pub struct ClusteredDataWriter<B: IcebergWriterBuilder> {
+    inner_builder: B,
+    current_writer: Option<B::R>,
+    current_partition: Option<Struct>,
+    closed_partitions: HashSet<Struct>,
+    output: Vec<DataFile>,
+}
+
+impl<B: IcebergWriterBuilder> ClusteredDataWriter<B> {
+    /// Create a new `ClusteredDataWriter`.
+    pub fn new(inner_builder: B) -> Self {
+        Self {
+            inner_builder,
+            current_writer: None,
+            current_partition: None,
+            closed_partitions: HashSet::new(),
+            output: Vec::new(),
+        }
+    }
+
+    /// Closes the current writer if it exists, flushes the written data to output, and record closed partition.
+    async fn close_current_writer(&mut self) -> Result<()> {
+        if let Some(mut writer) = self.current_writer.take() {
+            self.output.extend(writer.close().await?);
+
+            // Add the current partition to the set of closed partitions
+            if let Some(current_partition) = self.current_partition.take() {
+                self.closed_partitions.insert(current_partition);
+            }
+        }
+
+        Ok(())
+    }
+}
+
+#[async_trait]
+impl<B: IcebergWriterBuilder> PartitioningWriter for ClusteredDataWriter<B> {
+    async fn write(
+        &mut self,
+        partition_key: Option<PartitionKey>,
+        input: RecordBatch,
+    ) -> Result<()> {
+        if let Some(partition_key) = partition_key {
+            let partition_value = partition_key.data();
+
+            // Check if this partition has been closed already
+            if self.closed_partitions.contains(partition_value) {
+                return Err(Error::new(
+                    ErrorKind::Unexpected,
+                    format!(
+                        "The input is not sorted! Cannot write to partition that was previously closed: {:?}",
+                        partition_key
+                    ),
+                ));
+            }
+
+            // Check if we need to switch to a new partition
+            let need_new_writer = match &self.current_partition {
+                Some(current) => current != partition_value,
+                None => true,
+            };
+
+            if need_new_writer {
+                self.close_current_writer().await?;
+
+                // Create a new writer for the new partition
+                self.current_writer = Some(
+                    self.inner_builder
+                        .clone()
+                        .build_with_partition(Some(partition_key.clone()))
+                        .await?,
+                );
+                self.current_partition = Some(partition_value.clone());
+            }
+        } else if self.current_writer.is_none() {
+            // Unpartitioned data, initialize the writer here
+            self.current_writer = Some(
+                self.inner_builder
+                    .clone()
+                    .build_with_partition(None)
+                    .await?,
+            );
+        }
+
+        // do write
+        if let Some(writer) = &mut self.current_writer {
+            writer.write(input).await?;
+            Ok(())
+        } else {
+            Err(Error::new(
+                ErrorKind::Unexpected,
+                "Writer is not initialized!",
+            ))
+        }
+    }
+
+    async fn close(&mut self) -> Result<Vec<DataFile>> {
+        self.close_current_writer().await?;
+
+        // Return all collected data files
+        Ok(std::mem::take(&mut self.output))
+    }
+}
+
+#[cfg(test)]
+mod tests {
+    use std::collections::HashMap;
+    use std::sync::Arc;
+
+    use arrow_array::{Int32Array, StringArray};
+    use arrow_schema::{DataType, Field, Schema};
+    use parquet::arrow::PARQUET_FIELD_ID_META_KEY;
+    use parquet::file::properties::WriterProperties;
+    use tempfile::TempDir;
+
+    use super::*;
+    use crate::io::FileIOBuilder;
+    use crate::spec::{DataFileFormat, NestedField, PrimitiveType, Type};
+    use crate::writer::base_writer::data_file_writer::DataFileWriterBuilder;
+    use crate::writer::file_writer::ParquetWriterBuilder;
+    use crate::writer::file_writer::location_generator::{
+        DefaultFileNameGenerator, DefaultLocationGenerator,
+    };
+    use crate::writer::file_writer::rolling_writer::RollingFileWriterBuilder;
+
+    #[tokio::test]
+    async fn test_clustered_writer_unpartitioned() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                ])
+                .build()?,
+        );
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create clustered writer
+        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+        ]);
+
+        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2, 3])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob", "Charlie"])),
+        ])?;
+
+        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![4, 5])),
+            Arc::new(StringArray::from(vec!["Dave", "Eve"])),
+        ])?;
+
+        // Write data without partitioning (pass None for partition_key)
+        writer.write(None, batch1).await?;
+        writer.write(None, batch2).await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify at least one file was created
+        assert!(
+            !data_files.is_empty(),
+            "Expected at least one data file to be created"
+        );
+
+        Ok(())
+    }
+
+    #[tokio::test]
+    async fn test_clustered_writer_single_partition() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema with partition field
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                    NestedField::required(3, "region", Type::Primitive(PrimitiveType::String))
+                        .into(),
+                ])
+                .build()?,
+        );
+
+        // Create partition spec and key
+        let partition_spec = crate::spec::PartitionSpec::builder(schema.clone()).build()?;
+        let partition_value =
+            crate::spec::Struct::from_iter([Some(crate::spec::Literal::string("US"))]);
+        let partition_key =
+            crate::spec::PartitionKey::new(partition_spec, schema.clone(), partition_value.clone());
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create clustered writer
+        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+            Field::new("region", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                3.to_string(),
+            )])),
+        ]);
+
+        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![3, 4])),
+            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        // Write data to the same partition (this should work)
+        writer.write(Some(partition_key.clone()), batch1).await?;
+        writer.write(Some(partition_key.clone()), batch2).await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify at least one file was created
+        assert!(
+            !data_files.is_empty(),
+            "Expected at least one data file to be created"
+        );
+
+        // Verify that all data files have the correct partition value
+        for data_file in &data_files {
+            assert_eq!(data_file.partition, partition_value);
+        }
+
+        Ok(())
+    }
+
+    #[tokio::test]
+    async fn test_clustered_writer_sorted_partitions() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema with partition field
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                    NestedField::required(3, "region", Type::Primitive(PrimitiveType::String))
+                        .into(),
+                ])
+                .build()?,
+        );
+
+        // Create partition spec
+        let partition_spec = crate::spec::PartitionSpec::builder(schema.clone()).build()?;
+
+        // Create partition keys for different regions (in sorted order)
+        let partition_value_asia =
+            crate::spec::Struct::from_iter([Some(crate::spec::Literal::string("ASIA"))]);
+        let partition_key_asia = crate::spec::PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_asia.clone(),
+        );
+
+        let partition_value_eu =
+            crate::spec::Struct::from_iter([Some(crate::spec::Literal::string("EU"))]);
+        let partition_key_eu = crate::spec::PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_eu.clone(),
+        );
+
+        let partition_value_us =
+            crate::spec::Struct::from_iter([Some(crate::spec::Literal::string("US"))]);
+        let partition_key_us = crate::spec::PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_us.clone(),
+        );
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create clustered writer
+        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+            Field::new("region", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                3.to_string(),
+            )])),
+        ]);
+
+        // Create batches for different partitions (in sorted order)
+        let batch_asia = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
+            Arc::new(StringArray::from(vec!["ASIA", "ASIA"])),
+        ])?;
+
+        let batch_eu = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![3, 4])),
+            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
+            Arc::new(StringArray::from(vec!["EU", "EU"])),
+        ])?;
+
+        let batch_us = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![5, 6])),
+            Arc::new(StringArray::from(vec!["Eve", "Frank"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        // Write data in sorted partition order (this should work)
+        writer
+            .write(Some(partition_key_asia.clone()), batch_asia)
+            .await?;
+        writer
+            .write(Some(partition_key_eu.clone()), batch_eu)
+            .await?;
+        writer
+            .write(Some(partition_key_us.clone()), batch_us)
+            .await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify files were created for all partitions
+        assert!(
+            data_files.len() >= 3,
+            "Expected at least 3 data files (one per partition), got {}",
+            data_files.len()
+        );
+
+        // Verify that we have files for each partition
+        let mut partitions_found = std::collections::HashSet::new();
+        for data_file in &data_files {
+            partitions_found.insert(data_file.partition.clone());
+        }
+
+        assert!(
+            partitions_found.contains(&partition_value_asia),
+            "Missing ASIA partition"
+        );
+        assert!(
+            partitions_found.contains(&partition_value_eu),
+            "Missing EU partition"
+        );
+        assert!(
+            partitions_found.contains(&partition_value_us),
+            "Missing US partition"
+        );
+
+        Ok(())
+    }
+
+    #[tokio::test]
+    async fn test_clustered_writer_unsorted_partitions_error() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema with partition field
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                    NestedField::required(3, "region", Type::Primitive(PrimitiveType::String))
+                        .into(),
+                ])
+                .build()?,
+        );
+
+        // Create partition spec
+        let partition_spec = crate::spec::PartitionSpec::builder(schema.clone()).build()?;
+
+        // Create partition keys for different regions
+        let partition_value_us =
+            crate::spec::Struct::from_iter([Some(crate::spec::Literal::string("US"))]);
+        let partition_key_us = crate::spec::PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_us.clone(),
+        );
+
+        let partition_value_eu =
+            crate::spec::Struct::from_iter([Some(crate::spec::Literal::string("EU"))]);
+        let partition_key_eu = crate::spec::PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_eu.clone(),
+        );
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create clustered writer
+        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+            Field::new("region", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                3.to_string(),
+            )])),
+        ]);
+
+        // Create batches for different partitions
+        let batch_us = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        let batch_eu = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![3, 4])),
+            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
+            Arc::new(StringArray::from(vec!["EU", "EU"])),
+        ])?;
+
+        let batch_us2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![5])),
+            Arc::new(StringArray::from(vec!["Eve"])),
+            Arc::new(StringArray::from(vec!["US"])),
+        ])?;
+
+        // Write data to US partition first
+        writer
+            .write(Some(partition_key_us.clone()), batch_us)
+            .await?;
+
+        // Write data to EU partition (this closes US partition)
+        writer
+            .write(Some(partition_key_eu.clone()), batch_eu)
+            .await?;
+
+        // Try to write to US partition again - this should fail because data is not sorted
+        let result = writer
+            .write(Some(partition_key_us.clone()), batch_us2)
+            .await;
+
+        assert!(result.is_err(), "Expected error when writing unsorted data");
+
+        let error = result.unwrap_err();
+        assert!(
+            error.to_string().contains("The input is not sorted"),
+            "Expected 'input is not sorted' error, got: {}",
+            error
+        );
+
+        Ok(())
+    }
+}
diff --git a/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
new file mode 100644
index 000000000..5f52fc235
--- /dev/null
+++ b/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
@@ -0,0 +1,676 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+//! This module provides the `FanoutDataWriter` implementation.
+
+use std::collections::HashMap;
+
+use arrow_array::RecordBatch;
+use async_trait::async_trait;
+
+use crate::spec::{DataFile, PartitionKey, Struct};
+use crate::writer::partitioning::PartitioningWriter;
+use crate::writer::{IcebergWriter, IcebergWriterBuilder};
+use crate::{Error, ErrorKind, Result};
+
+/// A writer that can write data to multiple partitions simultaneously.
+///
+/// Unlike `ClusteredDataWriter` which expects sorted input and maintains only one active writer,
+/// `FanoutDataWriter` can handle unsorted data by maintaining multiple active writers in a map.
+/// This allows writing to any partition at any time, but uses more memory as all writers
+/// remain active until the writer is closed.
+#[derive(Clone)]
+pub struct FanoutDataWriter<B: IcebergWriterBuilder> {
+    inner_builder: B,
+    partition_writers: HashMap<Struct, B::R>,
+    unpartitioned_writer: Option<B::R>,
+    output: Vec<DataFile>,
+}
+
+impl<B: IcebergWriterBuilder> FanoutDataWriter<B> {
+    /// Create a new `FanoutDataWriter`.
+    pub fn new(inner_builder: B) -> Self {
+        Self {
+            inner_builder,
+            partition_writers: HashMap::new(),
+            unpartitioned_writer: None,
+            output: Vec::new(),
+        }
+    }
+
+    /// Get or create a writer for the specified partition.
+    async fn get_or_create_partition_writer(
+        &mut self,
+        partition_key: &PartitionKey,
+    ) -> Result<&mut B::R> {
+        if !self.partition_writers.contains_key(partition_key.data()) {
+            let writer = self
+                .inner_builder
+                .clone()
+                .build_with_partition(Some(partition_key.clone()))
+                .await?;
+            self.partition_writers
+                .insert(partition_key.data().clone(), writer);
+        }
+
+        self.partition_writers
+            .get_mut(partition_key.data())
+            .ok_or_else(|| {
+                Error::new(
+                    ErrorKind::Unexpected,
+                    "Failed to get partition writer after creation",
+                )
+            })
+    }
+
+    /// Get or create the unpartitioned writer.
+    async fn get_or_create_unpartitioned_writer(&mut self) -> Result<&mut B::R> {
+        if self.unpartitioned_writer.is_none() {
+            self.unpartitioned_writer = Some(
+                self.inner_builder
+                    .clone()
+                    .build_with_partition(None)
+                    .await?,
+            );
+        }
+
+        self.unpartitioned_writer.as_mut().ok_or_else(|| {
+            Error::new(
+                ErrorKind::Unexpected,
+                "Failed to get unpartitioned writer after creation",
+            )
+        })
+    }
+}
+
+#[async_trait]
+impl<B: IcebergWriterBuilder> PartitioningWriter for FanoutDataWriter<B> {
+    async fn write(
+        &mut self,
+        partition_key: Option<PartitionKey>,
+        input: RecordBatch,
+    ) -> Result<()> {
+        if let Some(ref partition_key) = partition_key {
+            let writer = self.get_or_create_partition_writer(&partition_key).await?;
+            writer.write(input).await
+        } else {
+            let writer = self.get_or_create_unpartitioned_writer().await?;
+            writer.write(input).await
+        }
+    }
+
+    async fn close(&mut self) -> Result<Vec<DataFile>> {
+        // Close all partition writers
+        for (_, mut writer) in std::mem::take(&mut self.partition_writers) {
+            self.output.extend(writer.close().await?);
+        }
+
+        // Close unpartitioned writer if it exists
+        if let Some(mut writer) = self.unpartitioned_writer.take() {
+            self.output.extend(writer.close().await?);
+        }
+
+        // Return all collected data files
+        Ok(std::mem::take(&mut self.output))
+    }
+}
+
+#[cfg(test)]
+mod tests {
+    use std::collections::HashMap;
+    use std::sync::Arc;
+
+    use arrow_array::{Int32Array, StringArray};
+    use arrow_schema::{DataType, Field, Schema};
+    use parquet::arrow::PARQUET_FIELD_ID_META_KEY;
+    use parquet::file::properties::WriterProperties;
+    use tempfile::TempDir;
+
+    use super::*;
+    use crate::io::FileIOBuilder;
+    use crate::spec::{
+        DataFileFormat, Literal, NestedField, PartitionKey, PartitionSpec, PrimitiveType, Struct,
+        Type,
+    };
+    use crate::writer::base_writer::data_file_writer::DataFileWriterBuilder;
+    use crate::writer::file_writer::ParquetWriterBuilder;
+    use crate::writer::file_writer::location_generator::{
+        DefaultFileNameGenerator, DefaultLocationGenerator,
+    };
+    use crate::writer::file_writer::rolling_writer::RollingFileWriterBuilder;
+
+    #[tokio::test]
+    async fn test_fanout_writer_unpartitioned() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                ])
+                .build()?,
+        );
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create fanout writer
+        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+        ]);
+
+        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2, 3])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob", "Charlie"])),
+        ])?;
+
+        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![4, 5])),
+            Arc::new(StringArray::from(vec!["Dave", "Eve"])),
+        ])?;
+
+        // Write data without partitioning (pass None for partition_key)
+        writer.write(None, batch1).await?;
+        writer.write(None, batch2).await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify at least one file was created
+        assert!(
+            !data_files.is_empty(),
+            "Expected at least one data file to be created"
+        );
+
+        Ok(())
+    }
+
+    #[tokio::test]
+    async fn test_fanout_writer_multiple_writes() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                ])
+                .build()?,
+        );
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create fanout writer
+        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+        ]);
+
+        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
+        ])?;
+
+        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![3, 4])),
+            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
+        ])?;
+
+        let batch3 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![5])),
+            Arc::new(StringArray::from(vec!["Eve"])),
+        ])?;
+
+        // Write multiple batches to demonstrate fanout capability
+        // (all unpartitioned for simplicity)
+        writer.write(None, batch1).await?;
+        writer.write(None, batch2).await?;
+        writer.write(None, batch3).await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify at least one file was created
+        assert!(
+            !data_files.is_empty(),
+            "Expected at least one data file to be created"
+        );
+
+        Ok(())
+    }
+
+    #[tokio::test]
+    async fn test_fanout_writer_single_partition() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema with partition field
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                    NestedField::required(3, "region", Type::Primitive(PrimitiveType::String))
+                        .into(),
+                ])
+                .build()?,
+        );
+
+        // Create partition spec - using the same pattern as data_file_writer tests
+        let partition_spec = PartitionSpec::builder(schema.clone()).build()?;
+        let partition_value = Struct::from_iter([Some(Literal::string("US"))]);
+        let partition_key =
+            PartitionKey::new(partition_spec, schema.clone(), partition_value.clone());
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create fanout writer
+        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+            Field::new("region", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                3.to_string(),
+            )])),
+        ]);
+
+        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![3, 4])),
+            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        // Write data to the same partition
+        writer.write(Some(partition_key.clone()), batch1).await?;
+        writer.write(Some(partition_key.clone()), batch2).await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify at least one file was created
+        assert!(
+            !data_files.is_empty(),
+            "Expected at least one data file to be created"
+        );
+
+        // Verify that all data files have the correct partition value
+        for data_file in &data_files {
+            assert_eq!(data_file.partition, partition_value);
+        }
+
+        Ok(())
+    }
+
+    #[tokio::test]
+    async fn test_fanout_writer_multiple_partitions() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema with partition field
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                    NestedField::required(3, "region", Type::Primitive(PrimitiveType::String))
+                        .into(),
+                ])
+                .build()?,
+        );
+
+        // Create partition spec
+        let partition_spec = PartitionSpec::builder(schema.clone()).build()?;
+
+        // Create partition keys for different regions
+        let partition_value_us = Struct::from_iter([Some(Literal::string("US"))]);
+        let partition_key_us = PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_us.clone(),
+        );
+
+        let partition_value_eu = Struct::from_iter([Some(Literal::string("EU"))]);
+        let partition_key_eu = PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_eu.clone(),
+        );
+
+        let partition_value_asia = Struct::from_iter([Some(Literal::string("ASIA"))]);
+        let partition_key_asia = PartitionKey::new(
+            partition_spec.clone(),
+            schema.clone(),
+            partition_value_asia.clone(),
+        );
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create fanout writer
+        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+            Field::new("region", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                3.to_string(),
+            )])),
+        ]);
+
+        // Create batches for different partitions
+        let batch_us1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        let batch_eu1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![3, 4])),
+            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
+            Arc::new(StringArray::from(vec!["EU", "EU"])),
+        ])?;
+
+        let batch_us2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![5])),
+            Arc::new(StringArray::from(vec!["Eve"])),
+            Arc::new(StringArray::from(vec!["US"])),
+        ])?;
+
+        let batch_asia1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![6, 7])),
+            Arc::new(StringArray::from(vec!["Frank", "Grace"])),
+            Arc::new(StringArray::from(vec!["ASIA", "ASIA"])),
+        ])?;
+
+        // Write data in mixed partition order to demonstrate fanout capability
+        // This is the key difference from ClusteredWriter - we can write to any partition at any time
+        writer
+            .write(Some(partition_key_us.clone()), batch_us1)
+            .await?;
+        writer
+            .write(Some(partition_key_eu.clone()), batch_eu1)
+            .await?;
+        writer
+            .write(Some(partition_key_us.clone()), batch_us2)
+            .await?; // Back to US partition
+        writer
+            .write(Some(partition_key_asia.clone()), batch_asia1)
+            .await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify files were created for all partitions
+        assert!(
+            data_files.len() >= 3,
+            "Expected at least 3 data files (one per partition), got {}",
+            data_files.len()
+        );
+
+        // Verify that we have files for each partition
+        let mut partitions_found = std::collections::HashSet::new();
+        for data_file in &data_files {
+            partitions_found.insert(data_file.partition.clone());
+        }
+
+        assert!(
+            partitions_found.contains(&partition_value_us),
+            "Missing US partition"
+        );
+        assert!(
+            partitions_found.contains(&partition_value_eu),
+            "Missing EU partition"
+        );
+        assert!(
+            partitions_found.contains(&partition_value_asia),
+            "Missing ASIA partition"
+        );
+
+        Ok(())
+    }
+
+    #[tokio::test]
+    async fn test_fanout_writer_mixed_partitioned_unpartitioned() -> Result<()> {
+        let temp_dir = TempDir::new()?;
+        let file_io = FileIOBuilder::new_fs_io().build()?;
+        let location_gen = DefaultLocationGenerator::with_data_location(
+            temp_dir.path().to_str().unwrap().to_string(),
+        );
+        let file_name_gen =
+            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
+
+        // Create schema
+        let schema = Arc::new(
+            crate::spec::Schema::builder()
+                .with_schema_id(1)
+                .with_fields(vec![
+                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
+                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
+                    NestedField::required(3, "region", Type::Primitive(PrimitiveType::String))
+                        .into(),
+                ])
+                .build()?,
+        );
+
+        // Create partition spec and key
+        let partition_spec = PartitionSpec::builder(schema.clone()).build()?;
+        let partition_value_us = Struct::from_iter([Some(Literal::string("US"))]);
+        let partition_key_us =
+            PartitionKey::new(partition_spec, schema.clone(), partition_value_us.clone());
+
+        // Create writer builder
+        let parquet_writer_builder =
+            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
+
+        // Create rolling file writer builder
+        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
+            parquet_writer_builder,
+            file_io.clone(),
+            location_gen,
+            file_name_gen,
+        );
+
+        // Create data file writer builder
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
+
+        // Create fanout writer
+        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+
+        // Create test data with proper field ID metadata
+        let arrow_schema = Schema::new(vec![
+            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                1.to_string(),
+            )])),
+            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                2.to_string(),
+            )])),
+            Field::new("region", DataType::Utf8, false).with_metadata(HashMap::from([(
+                PARQUET_FIELD_ID_META_KEY.to_string(),
+                3.to_string(),
+            )])),
+        ]);
+
+        // Create batches
+        let batch_partitioned = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![1, 2])),
+            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
+            Arc::new(StringArray::from(vec!["US", "US"])),
+        ])?;
+
+        let batch_unpartitioned = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
+            Arc::new(Int32Array::from(vec![3, 4])),
+            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
+            Arc::new(StringArray::from(vec!["UNKNOWN", "UNKNOWN"])),
+        ])?;
+
+        // Write both partitioned and unpartitioned data
+        writer
+            .write(Some(partition_key_us), batch_partitioned)
+            .await?;
+        writer.write(None, batch_unpartitioned).await?;
+
+        // Close writer and get data files
+        let data_files = writer.close().await?;
+
+        // Verify files were created for both partitioned and unpartitioned data
+        assert!(
+            data_files.len() >= 2,
+            "Expected at least 2 data files (partitioned + unpartitioned), got {}",
+            data_files.len()
+        );
+
+        // Verify we have both partitioned and unpartitioned files
+        let mut has_partitioned = false;
+        let mut has_unpartitioned = false;
+
+        for data_file in &data_files {
+            if data_file.partition == partition_value_us {
+                has_partitioned = true;
+            } else if data_file.partition == Struct::empty() {
+                has_unpartitioned = true;
+            }
+        }
+
+        assert!(has_partitioned, "Missing partitioned data file");
+        assert!(has_unpartitioned, "Missing unpartitioned data file");
+
+        Ok(())
+    }
+}
diff --git a/crates/iceberg/src/writer/partitioning/mod.rs b/crates/iceberg/src/writer/partitioning/mod.rs
new file mode 100644
index 000000000..751efb9cc
--- /dev/null
+++ b/crates/iceberg/src/writer/partitioning/mod.rs
@@ -0,0 +1,49 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+pub mod clustered_data_writer;
+pub mod fanout_data_writer;
+
+use crate::Result;
+use crate::spec::PartitionKey;
+use crate::writer::{DefaultInput, DefaultOutput};
+
+/// A writer that can write data to partitioned tables.
+///
+/// This trait provides methods for writing data with optional partition keys and
+/// closing the writer to retrieve the output.
+#[async_trait::async_trait]
+pub trait PartitioningWriter<I = DefaultInput, O = DefaultOutput>: Send + 'static {
+    /// Write data with an optional partition key.
+    ///
+    /// # Parameters
+    ///
+    /// * `partition_key` - Optional partition key to determine which partition to write to
+    /// * `input` - The input data to write
+    ///
+    /// # Returns
+    ///
+    /// `Ok(())` on success, or an error if the write operation fails.
+    async fn write(&mut self, partition_key: Option<PartitionKey>, input: I) -> Result<()>;
+
+    /// Close the writer and return the output.
+    ///
+    /// # Returns
+    ///
+    /// The accumulated output from all write operations.
+    async fn close(&mut self) -> Result<O>;
+}
diff --git a/crates/integrations/datafusion/src/physical_plan/write.rs b/crates/integrations/datafusion/src/physical_plan/write.rs
index 712da92b2..37a0d8c7a 100644
--- a/crates/integrations/datafusion/src/physical_plan/write.rs
+++ b/crates/integrations/datafusion/src/physical_plan/write.rs
@@ -256,6 +256,7 @@ impl ExecutionPlan for IcebergWriteExec {
         };
 
         let file_io = self.table.file_io().clone();
+        // todo location_gen and file_name_gen should be configurable
         let location_generator = DefaultLocationGenerator::new(self.table.metadata().clone())
             .map_err(to_datafusion_error)?;
         // todo filename prefix/suffix should be configurable
@@ -268,8 +269,7 @@ impl ExecutionPlan for IcebergWriteExec {
             location_generator,
             file_name_generator,
         );
-        // todo specify partition key when partitioning writer is supported
-        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder, None);
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Get input data
         let data = execute_input_stream(
@@ -285,7 +285,8 @@ impl ExecutionPlan for IcebergWriteExec {
         // Create write stream
         let stream = futures::stream::once(async move {
             let mut writer = data_file_writer_builder
-                .build()
+                // todo specify partition key when partitioning writer is supported
+                .build_with_partition(None)
                 .await
                 .map_err(to_datafusion_error)?;
             let mut input_stream = data;

From 36bac114bb7e4af02aae14e8d84f3c8b21749ba1 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Thu, 9 Oct 2025 21:34:14 -0700
Subject: [PATCH 02/11] fix usages

---
 .../src/writer/file_writer/rolling_writer.rs  |  9 +++---
 .../shared_tests/append_data_file_test.rs     |  7 +++--
 .../append_partition_data_file_test.rs        | 30 ++++++++-----------
 .../shared_tests/conflict_commit_test.rs      |  7 +++--
 .../tests/shared_tests/scan_all_type.rs       |  7 +++--
 5 files changed, 32 insertions(+), 28 deletions(-)

diff --git a/crates/iceberg/src/writer/file_writer/rolling_writer.rs b/crates/iceberg/src/writer/file_writer/rolling_writer.rs
index 0b9b105c5..0ffd48b39 100644
--- a/crates/iceberg/src/writer/file_writer/rolling_writer.rs
+++ b/crates/iceberg/src/writer/file_writer/rolling_writer.rs
@@ -329,11 +329,10 @@ mod tests {
             file_name_gen,
         );
 
-        let data_file_writer_builder =
-            DataFileWriterBuilder::new(rolling_file_writer_builder, None);
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
 
         // Create writer
-        let mut writer = data_file_writer_builder.build().await?;
+        let mut writer = data_file_writer_builder.build_with_partition(None).await?;
 
         // Create test data
         let arrow_schema = make_test_arrow_schema();
@@ -388,10 +387,10 @@ mod tests {
             file_name_gen,
         );
 
-        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder, None);
+        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create writer
-        let mut writer = data_file_writer_builder.build().await?;
+        let mut writer = data_file_writer_builder.build_with_partition(None).await?;
 
         // Create test data
         let arrow_schema = make_test_arrow_schema();
diff --git a/crates/integration_tests/tests/shared_tests/append_data_file_test.rs b/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
index f4cba959e..4488dfff7 100644
--- a/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
+++ b/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
@@ -82,8 +82,11 @@ async fn test_append_data_file() {
         location_generator.clone(),
         file_name_generator.clone(),
     );
-    let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder, None);
-    let mut data_file_writer = data_file_writer_builder.build().await.unwrap();
+    let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
+    let mut data_file_writer = data_file_writer_builder
+        .build_with_partition(None)
+        .await
+        .unwrap();
     let col1 = StringArray::from(vec![Some("foo"), Some("bar"), None, Some("baz")]);
     let col2 = Int32Array::from(vec![Some(1), Some(2), Some(3), Some(4)]);
     let col3 = BooleanArray::from(vec![Some(true), Some(false), None, Some(false)]);
diff --git a/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs b/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs
index 0da88f1a0..47080e2e1 100644
--- a/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs
+++ b/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs
@@ -106,13 +106,11 @@ async fn test_append_partition_data_file() {
         file_name_generator.clone(),
     );
 
-    let mut data_file_writer_valid = DataFileWriterBuilder::new(
-        rolling_file_writer_builder.clone(),
-        Some(partition_key.clone()),
-    )
-    .build()
-    .await
-    .unwrap();
+    let mut data_file_writer_valid =
+        DataFileWriterBuilder::new(rolling_file_writer_builder.clone())
+            .build_with_partition(Some(partition_key.clone()))
+            .await
+            .unwrap();
 
     let col1 = StringArray::from(vec![Some("foo1"), Some("foo2")]);
     let col2 = Int32Array::from(vec![
@@ -191,11 +189,10 @@ async fn test_schema_incompatible_partition_type(
     catalog: &dyn Catalog,
 ) {
     // test writing different "type" of partition than mentioned in schema
-    let mut data_file_writer_invalid =
-        DataFileWriterBuilder::new(rolling_file_writer_builder, Some(partition_key))
-            .build()
-            .await
-            .unwrap();
+    let mut data_file_writer_invalid = DataFileWriterBuilder::new(rolling_file_writer_builder)
+        .build_with_partition(Some(partition_key))
+        .await
+        .unwrap();
 
     data_file_writer_invalid.write(batch.clone()).await.unwrap();
     let data_file_invalid = data_file_writer_invalid.close().await.unwrap();
@@ -221,11 +218,10 @@ async fn test_schema_incompatible_partition_fields(
     catalog: &dyn Catalog,
 ) {
     // test writing different number of partition fields than mentioned in schema
-    let mut data_file_writer_invalid =
-        DataFileWriterBuilder::new(rolling_file_writer_builder, Some(partition_key))
-            .build()
-            .await
-            .unwrap();
+    let mut data_file_writer_invalid = DataFileWriterBuilder::new(rolling_file_writer_builder)
+        .build_with_partition(Some(partition_key))
+        .await
+        .unwrap();
 
     data_file_writer_invalid.write(batch.clone()).await.unwrap();
     let data_file_invalid = data_file_writer_invalid.close().await.unwrap();
diff --git a/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs b/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
index a248fa707..bc37ce2a2 100644
--- a/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
+++ b/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
@@ -81,8 +81,11 @@ async fn test_append_data_file_conflict() {
         location_generator.clone(),
         file_name_generator.clone(),
     );
-    let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder, None);
-    let mut data_file_writer = data_file_writer_builder.build().await.unwrap();
+    let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
+    let mut data_file_writer = data_file_writer_builder
+        .build_with_partition(None)
+        .await
+        .unwrap();
     let col1 = StringArray::from(vec![Some("foo"), Some("bar"), None, Some("baz")]);
     let col2 = Int32Array::from(vec![Some(1), Some(2), Some(3), Some(4)]);
     let col3 = BooleanArray::from(vec![Some(true), Some(false), None, Some(false)]);
diff --git a/crates/integration_tests/tests/shared_tests/scan_all_type.rs b/crates/integration_tests/tests/shared_tests/scan_all_type.rs
index 1125de11a..870f7ef92 100644
--- a/crates/integration_tests/tests/shared_tests/scan_all_type.rs
+++ b/crates/integration_tests/tests/shared_tests/scan_all_type.rs
@@ -163,8 +163,11 @@ async fn test_scan_all_type() {
         location_generator.clone(),
         file_name_generator.clone(),
     );
-    let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder, None);
-    let mut data_file_writer = data_file_writer_builder.build().await.unwrap();
+    let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
+    let mut data_file_writer = data_file_writer_builder
+        .build_with_partition(None)
+        .await
+        .unwrap();
 
     // Prepare data
     let col1 = Int32Array::from(vec![1, 2, 3, 4, 5]);

From 34917d415c9b04d87766c6ee78af075680e677f1 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Thu, 9 Oct 2025 21:55:33 -0700
Subject: [PATCH 03/11] daily clippy fix

---
 crates/iceberg/src/writer/partitioning/fanout_data_writer.rs | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
index 5f52fc235..ff7566fcc 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
@@ -104,7 +104,7 @@ impl<B: IcebergWriterBuilder> PartitioningWriter for FanoutDataWriter<B> {
         partition_key: Option<PartitionKey>,
         input: RecordBatch,
     ) -> Result<()> {
-        if let Some(ref partition_key) = partition_key {
+        if let Some(partition_key) = partition_key {
             let writer = self.get_or_create_partition_writer(&partition_key).await?;
             writer.write(input).await
         } else {

From 6251fc8463b80f4478addd7c23fdb84425dcc683 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Mon, 13 Oct 2025 15:56:04 -0700
Subject: [PATCH 04/11] trying with generic IO

---
 .../partitioning/clustered_data_writer.rs     | 62 +++++++++++++------
 .../writer/partitioning/fanout_data_writer.rs | 59 ++++++++++++------
 2 files changed, 84 insertions(+), 37 deletions(-)

diff --git a/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs b/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
index f8f458d74..39db8c39b 100644
--- a/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
@@ -18,26 +18,47 @@
 //! This module provides the `ClusteredDataWriter` implementation.
 
 use std::collections::HashSet;
+use std::marker::PhantomData;
 
-use arrow_array::RecordBatch;
 use async_trait::async_trait;
 
-use crate::spec::{DataFile, PartitionKey, Struct};
+use crate::spec::{PartitionKey, Struct};
 use crate::writer::partitioning::PartitioningWriter;
-use crate::writer::{IcebergWriter, IcebergWriterBuilder};
+use crate::writer::{DefaultInput, DefaultOutput, IcebergWriter, IcebergWriterBuilder};
 use crate::{Error, ErrorKind, Result};
 
 /// A writer that writes data to a single partition at a time.
+///
+/// This writer expects input data to be sorted by partition key. It maintains only one
+/// active writer at a time, making it memory efficient for sorted data.
+///
+/// # Type Parameters
+///
+/// * `B` - The inner writer builder type
+/// * `I` - Input type (defaults to `RecordBatch`)
+/// * `O` - Output collection type (defaults to `Vec<DataFile>`)
 #[derive(Clone)]
-pub struct ClusteredDataWriter<B: IcebergWriterBuilder> {
+pub struct ClusteredDataWriter<B, I = DefaultInput, O = DefaultOutput>
+where
+    B: IcebergWriterBuilder<I, O>,
+    O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
+    <O as IntoIterator>::Item: Clone,
+{
     inner_builder: B,
     current_writer: Option<B::R>,
     current_partition: Option<Struct>,
     closed_partitions: HashSet<Struct>,
-    output: Vec<DataFile>,
+    output: Vec<<O as IntoIterator>::Item>,
+    _phantom: PhantomData<I>,
 }
 
-impl<B: IcebergWriterBuilder> ClusteredDataWriter<B> {
+impl<B, I, O> ClusteredDataWriter<B, I, O>
+where
+    B: IcebergWriterBuilder<I, O>,
+    I: Send + 'static,
+    O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
+    <O as IntoIterator>::Item: Send + Clone,
+{
     /// Create a new `ClusteredDataWriter`.
     pub fn new(inner_builder: B) -> Self {
         Self {
@@ -46,13 +67,15 @@ impl<B: IcebergWriterBuilder> ClusteredDataWriter<B> {
             current_partition: None,
             closed_partitions: HashSet::new(),
             output: Vec::new(),
+            _phantom: PhantomData,
         }
     }
 
     /// Closes the current writer if it exists, flushes the written data to output, and record closed partition.
     async fn close_current_writer(&mut self) -> Result<()> {
         if let Some(mut writer) = self.current_writer.take() {
-            self.output.extend(writer.close().await?);
+            let result = writer.close().await?;
+            self.output.extend(result);
 
             // Add the current partition to the set of closed partitions
             if let Some(current_partition) = self.current_partition.take() {
@@ -65,12 +88,14 @@ impl<B: IcebergWriterBuilder> ClusteredDataWriter<B> {
 }
 
 #[async_trait]
-impl<B: IcebergWriterBuilder> PartitioningWriter for ClusteredDataWriter<B> {
-    async fn write(
-        &mut self,
-        partition_key: Option<PartitionKey>,
-        input: RecordBatch,
-    ) -> Result<()> {
+impl<B, I, O> PartitioningWriter<I, O> for ClusteredDataWriter<B, I, O>
+where
+    B: IcebergWriterBuilder<I, O>,
+    I: Send + 'static,
+    O: IntoIterator + FromIterator<<O as IntoIterator>::Item> + Send + 'static,
+    <O as IntoIterator>::Item: Send + Clone,
+{
+    async fn write(&mut self, partition_key: Option<PartitionKey>, input: I) -> Result<()> {
         if let Some(partition_key) = partition_key {
             let partition_value = partition_key.data();
 
@@ -115,8 +140,7 @@ impl<B: IcebergWriterBuilder> PartitioningWriter for ClusteredDataWriter<B> {
 
         // do write
         if let Some(writer) = &mut self.current_writer {
-            writer.write(input).await?;
-            Ok(())
+            writer.write(input).await
         } else {
             Err(Error::new(
                 ErrorKind::Unexpected,
@@ -125,11 +149,11 @@ impl<B: IcebergWriterBuilder> PartitioningWriter for ClusteredDataWriter<B> {
         }
     }
 
-    async fn close(&mut self) -> Result<Vec<DataFile>> {
+    async fn close(&mut self) -> Result<O> {
         self.close_current_writer().await?;
 
-        // Return all collected data files
-        Ok(std::mem::take(&mut self.output))
+        // Collect all output items into the output collection type
+        Ok(O::from_iter(std::mem::take(&mut self.output)))
     }
 }
 
@@ -138,7 +162,7 @@ mod tests {
     use std::collections::HashMap;
     use std::sync::Arc;
 
-    use arrow_array::{Int32Array, StringArray};
+    use arrow_array::{Int32Array, RecordBatch, StringArray};
     use arrow_schema::{DataType, Field, Schema};
     use parquet::arrow::PARQUET_FIELD_ID_META_KEY;
     use parquet::file::properties::WriterProperties;
diff --git a/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
index ff7566fcc..60e6e6139 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
@@ -18,13 +18,13 @@
 //! This module provides the `FanoutDataWriter` implementation.
 
 use std::collections::HashMap;
+use std::marker::PhantomData;
 
-use arrow_array::RecordBatch;
 use async_trait::async_trait;
 
-use crate::spec::{DataFile, PartitionKey, Struct};
+use crate::spec::{PartitionKey, Struct};
 use crate::writer::partitioning::PartitioningWriter;
-use crate::writer::{IcebergWriter, IcebergWriterBuilder};
+use crate::writer::{DefaultInput, DefaultOutput, IcebergWriter, IcebergWriterBuilder};
 use crate::{Error, ErrorKind, Result};
 
 /// A writer that can write data to multiple partitions simultaneously.
@@ -33,15 +33,33 @@ use crate::{Error, ErrorKind, Result};
 /// `FanoutDataWriter` can handle unsorted data by maintaining multiple active writers in a map.
 /// This allows writing to any partition at any time, but uses more memory as all writers
 /// remain active until the writer is closed.
+///
+/// # Type Parameters
+///
+/// * `B` - The inner writer builder type
+/// * `I` - Input type (defaults to `RecordBatch`)
+/// * `O` - Output collection type (defaults to `Vec<DataFile>`)
 #[derive(Clone)]
-pub struct FanoutDataWriter<B: IcebergWriterBuilder> {
+pub struct FanoutDataWriter<B, I = DefaultInput, O = DefaultOutput>
+where
+    B: IcebergWriterBuilder<I, O>,
+    O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
+    <O as IntoIterator>::Item: Clone,
+{
     inner_builder: B,
     partition_writers: HashMap<Struct, B::R>,
     unpartitioned_writer: Option<B::R>,
-    output: Vec<DataFile>,
+    output: Vec<<O as IntoIterator>::Item>,
+    _phantom: PhantomData<I>,
 }
 
-impl<B: IcebergWriterBuilder> FanoutDataWriter<B> {
+impl<B, I, O> FanoutDataWriter<B, I, O>
+where
+    B: IcebergWriterBuilder<I, O>,
+    I: Send + 'static,
+    O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
+    <O as IntoIterator>::Item: Send + Clone,
+{
     /// Create a new `FanoutDataWriter`.
     pub fn new(inner_builder: B) -> Self {
         Self {
@@ -49,6 +67,7 @@ impl<B: IcebergWriterBuilder> FanoutDataWriter<B> {
             partition_writers: HashMap::new(),
             unpartitioned_writer: None,
             output: Vec::new(),
+            _phantom: PhantomData,
         }
     }
 
@@ -98,12 +117,14 @@ impl<B: IcebergWriterBuilder> FanoutDataWriter<B> {
 }
 
 #[async_trait]
-impl<B: IcebergWriterBuilder> PartitioningWriter for FanoutDataWriter<B> {
-    async fn write(
-        &mut self,
-        partition_key: Option<PartitionKey>,
-        input: RecordBatch,
-    ) -> Result<()> {
+impl<B, I, O> PartitioningWriter<I, O> for FanoutDataWriter<B, I, O>
+where
+    B: IcebergWriterBuilder<I, O>,
+    I: Send + 'static,
+    O: IntoIterator + FromIterator<<O as IntoIterator>::Item> + Send + 'static,
+    <O as IntoIterator>::Item: Send + Clone,
+{
+    async fn write(&mut self, partition_key: Option<PartitionKey>, input: I) -> Result<()> {
         if let Some(partition_key) = partition_key {
             let writer = self.get_or_create_partition_writer(&partition_key).await?;
             writer.write(input).await
@@ -113,19 +134,21 @@ impl<B: IcebergWriterBuilder> PartitioningWriter for FanoutDataWriter<B> {
         }
     }
 
-    async fn close(&mut self) -> Result<Vec<DataFile>> {
+    async fn close(&mut self) -> Result<O> {
         // Close all partition writers
         for (_, mut writer) in std::mem::take(&mut self.partition_writers) {
-            self.output.extend(writer.close().await?);
+            let result = writer.close().await?;
+            self.output.extend(result);
         }
 
         // Close unpartitioned writer if it exists
         if let Some(mut writer) = self.unpartitioned_writer.take() {
-            self.output.extend(writer.close().await?);
+            let result = writer.close().await?;
+            self.output.extend(result);
         }
 
-        // Return all collected data files
-        Ok(std::mem::take(&mut self.output))
+        // Collect all output items into the output collection type
+        Ok(O::from_iter(std::mem::take(&mut self.output)))
     }
 }
 
@@ -134,7 +157,7 @@ mod tests {
     use std::collections::HashMap;
     use std::sync::Arc;
 
-    use arrow_array::{Int32Array, StringArray};
+    use arrow_array::{Int32Array, RecordBatch, StringArray};
     use arrow_schema::{DataType, Field, Schema};
     use parquet::arrow::PARQUET_FIELD_ID_META_KEY;
     use parquet::file::properties::WriterProperties;

From 19b421d1da39540c743469a45a86b5031f885217 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Mon, 13 Oct 2025 16:16:58 -0700
Subject: [PATCH 05/11] better naming for generic partitioning writer

---
 ...red_data_writer.rs => clustered_writer.rs} | 21 +++++++------
 ...fanout_data_writer.rs => fanout_writer.rs} | 30 +++++++++----------
 crates/iceberg/src/writer/partitioning/mod.rs |  4 +--
 3 files changed, 26 insertions(+), 29 deletions(-)
 rename crates/iceberg/src/writer/partitioning/{clustered_data_writer.rs => clustered_writer.rs} (97%)
 rename crates/iceberg/src/writer/partitioning/{fanout_data_writer.rs => fanout_writer.rs} (96%)

diff --git a/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
similarity index 97%
rename from crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
rename to crates/iceberg/src/writer/partitioning/clustered_writer.rs
index 39db8c39b..f201a292e 100644
--- a/crates/iceberg/src/writer/partitioning/clustered_data_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
@@ -15,7 +15,7 @@
 // specific language governing permissions and limitations
 // under the License.
 
-//! This module provides the `ClusteredDataWriter` implementation.
+//! This module provides the `ClusteredWriter` implementation.
 
 use std::collections::HashSet;
 use std::marker::PhantomData;
@@ -38,7 +38,7 @@ use crate::{Error, ErrorKind, Result};
 /// * `I` - Input type (defaults to `RecordBatch`)
 /// * `O` - Output collection type (defaults to `Vec<DataFile>`)
 #[derive(Clone)]
-pub struct ClusteredDataWriter<B, I = DefaultInput, O = DefaultOutput>
+pub struct ClusteredWriter<B, I = DefaultInput, O = DefaultOutput>
 where
     B: IcebergWriterBuilder<I, O>,
     O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
@@ -52,14 +52,14 @@ where
     _phantom: PhantomData<I>,
 }
 
-impl<B, I, O> ClusteredDataWriter<B, I, O>
+impl<B, I, O> ClusteredWriter<B, I, O>
 where
     B: IcebergWriterBuilder<I, O>,
     I: Send + 'static,
     O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
     <O as IntoIterator>::Item: Send + Clone,
 {
-    /// Create a new `ClusteredDataWriter`.
+    /// Create a new `ClusteredWriter`.
     pub fn new(inner_builder: B) -> Self {
         Self {
             inner_builder,
@@ -74,8 +74,7 @@ where
     /// Closes the current writer if it exists, flushes the written data to output, and record closed partition.
     async fn close_current_writer(&mut self) -> Result<()> {
         if let Some(mut writer) = self.current_writer.take() {
-            let result = writer.close().await?;
-            self.output.extend(result);
+            self.output.extend(writer.close().await?);
 
             // Add the current partition to the set of closed partitions
             if let Some(current_partition) = self.current_partition.take() {
@@ -88,7 +87,7 @@ where
 }
 
 #[async_trait]
-impl<B, I, O> PartitioningWriter<I, O> for ClusteredDataWriter<B, I, O>
+impl<B, I, O> PartitioningWriter<I, O> for ClusteredWriter<B, I, O>
 where
     B: IcebergWriterBuilder<I, O>,
     I: Send + 'static,
@@ -215,7 +214,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create clustered writer
-        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+        let mut writer = ClusteredWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
@@ -301,7 +300,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create clustered writer
-        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+        let mut writer = ClusteredWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
@@ -419,7 +418,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create clustered writer
-        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+        let mut writer = ClusteredWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
@@ -558,7 +557,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create clustered writer
-        let mut writer = ClusteredDataWriter::new(data_file_writer_builder);
+        let mut writer = ClusteredWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
diff --git a/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
similarity index 96%
rename from crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
rename to crates/iceberg/src/writer/partitioning/fanout_writer.rs
index 60e6e6139..345d8a64f 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_data_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
@@ -15,7 +15,7 @@
 // specific language governing permissions and limitations
 // under the License.
 
-//! This module provides the `FanoutDataWriter` implementation.
+//! This module provides the `FanoutWriter` implementation.
 
 use std::collections::HashMap;
 use std::marker::PhantomData;
@@ -29,8 +29,8 @@ use crate::{Error, ErrorKind, Result};
 
 /// A writer that can write data to multiple partitions simultaneously.
 ///
-/// Unlike `ClusteredDataWriter` which expects sorted input and maintains only one active writer,
-/// `FanoutDataWriter` can handle unsorted data by maintaining multiple active writers in a map.
+/// Unlike `ClusteredWriter` which expects sorted input and maintains only one active writer,
+/// `FanoutWriter` can handle unsorted data by maintaining multiple active writers in a map.
 /// This allows writing to any partition at any time, but uses more memory as all writers
 /// remain active until the writer is closed.
 ///
@@ -40,7 +40,7 @@ use crate::{Error, ErrorKind, Result};
 /// * `I` - Input type (defaults to `RecordBatch`)
 /// * `O` - Output collection type (defaults to `Vec<DataFile>`)
 #[derive(Clone)]
-pub struct FanoutDataWriter<B, I = DefaultInput, O = DefaultOutput>
+pub struct FanoutWriter<B, I = DefaultInput, O = DefaultOutput>
 where
     B: IcebergWriterBuilder<I, O>,
     O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
@@ -53,14 +53,14 @@ where
     _phantom: PhantomData<I>,
 }
 
-impl<B, I, O> FanoutDataWriter<B, I, O>
+impl<B, I, O> FanoutWriter<B, I, O>
 where
     B: IcebergWriterBuilder<I, O>,
     I: Send + 'static,
     O: IntoIterator + FromIterator<<O as IntoIterator>::Item>,
     <O as IntoIterator>::Item: Send + Clone,
 {
-    /// Create a new `FanoutDataWriter`.
+    /// Create a new `FanoutWriter`.
     pub fn new(inner_builder: B) -> Self {
         Self {
             inner_builder,
@@ -117,7 +117,7 @@ where
 }
 
 #[async_trait]
-impl<B, I, O> PartitioningWriter<I, O> for FanoutDataWriter<B, I, O>
+impl<B, I, O> PartitioningWriter<I, O> for FanoutWriter<B, I, O>
 where
     B: IcebergWriterBuilder<I, O>,
     I: Send + 'static,
@@ -137,14 +137,12 @@ where
     async fn close(&mut self) -> Result<O> {
         // Close all partition writers
         for (_, mut writer) in std::mem::take(&mut self.partition_writers) {
-            let result = writer.close().await?;
-            self.output.extend(result);
+            self.output.extend(writer.close().await?);
         }
 
         // Close unpartitioned writer if it exists
         if let Some(mut writer) = self.unpartitioned_writer.take() {
-            let result = writer.close().await?;
-            self.output.extend(result);
+            self.output.extend(writer.close().await?);
         }
 
         // Collect all output items into the output collection type
@@ -213,7 +211,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create fanout writer
-        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+        let mut writer = FanoutWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
@@ -290,7 +288,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create fanout writer
-        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+        let mut writer = FanoutWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
@@ -382,7 +380,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create fanout writer
-        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+        let mut writer = FanoutWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
@@ -497,7 +495,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create fanout writer
-        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+        let mut writer = FanoutWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
@@ -632,7 +630,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create fanout writer
-        let mut writer = FanoutDataWriter::new(data_file_writer_builder);
+        let mut writer = FanoutWriter::new(data_file_writer_builder);
 
         // Create test data with proper field ID metadata
         let arrow_schema = Schema::new(vec![
diff --git a/crates/iceberg/src/writer/partitioning/mod.rs b/crates/iceberg/src/writer/partitioning/mod.rs
index 751efb9cc..e7615a867 100644
--- a/crates/iceberg/src/writer/partitioning/mod.rs
+++ b/crates/iceberg/src/writer/partitioning/mod.rs
@@ -15,8 +15,8 @@
 // specific language governing permissions and limitations
 // under the License.
 
-pub mod clustered_data_writer;
-pub mod fanout_data_writer;
+pub mod clustered_writer;
+pub mod fanout_writer;
 
 use crate::Result;
 use crate::spec::PartitionKey;

From cd53509440b5838218533bcc7829768855198509 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Tue, 14 Oct 2025 13:42:26 -0700
Subject: [PATCH 06/11] consume writer when closing

---
 .../iceberg/src/writer/partitioning/clustered_writer.rs   | 4 ++--
 crates/iceberg/src/writer/partitioning/fanout_writer.rs   | 8 ++++----
 crates/iceberg/src/writer/partitioning/mod.rs             | 4 +++-
 3 files changed, 9 insertions(+), 7 deletions(-)

diff --git a/crates/iceberg/src/writer/partitioning/clustered_writer.rs b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
index f201a292e..52875f72a 100644
--- a/crates/iceberg/src/writer/partitioning/clustered_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
@@ -148,11 +148,11 @@ where
         }
     }
 
-    async fn close(&mut self) -> Result<O> {
+    async fn close(mut self) -> Result<O> {
         self.close_current_writer().await?;
 
         // Collect all output items into the output collection type
-        Ok(O::from_iter(std::mem::take(&mut self.output)))
+        Ok(O::from_iter(self.output))
     }
 }
 
diff --git a/crates/iceberg/src/writer/partitioning/fanout_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
index 345d8a64f..3a7dca810 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
@@ -134,19 +134,19 @@ where
         }
     }
 
-    async fn close(&mut self) -> Result<O> {
+    async fn close(mut self) -> Result<O> {
         // Close all partition writers
-        for (_, mut writer) in std::mem::take(&mut self.partition_writers) {
+        for (_, mut writer) in self.partition_writers {
             self.output.extend(writer.close().await?);
         }
 
         // Close unpartitioned writer if it exists
-        if let Some(mut writer) = self.unpartitioned_writer.take() {
+        if let Some(mut writer) = self.unpartitioned_writer {
             self.output.extend(writer.close().await?);
         }
 
         // Collect all output items into the output collection type
-        Ok(O::from_iter(std::mem::take(&mut self.output)))
+        Ok(O::from_iter(self.output))
     }
 }
 
diff --git a/crates/iceberg/src/writer/partitioning/mod.rs b/crates/iceberg/src/writer/partitioning/mod.rs
index e7615a867..d34717c25 100644
--- a/crates/iceberg/src/writer/partitioning/mod.rs
+++ b/crates/iceberg/src/writer/partitioning/mod.rs
@@ -42,8 +42,10 @@ pub trait PartitioningWriter<I = DefaultInput, O = DefaultOutput>: Send + 'stati
 
     /// Close the writer and return the output.
     ///
+    /// This method consumes the writer, preventing further use after closing.
+    ///
     /// # Returns
     ///
     /// The accumulated output from all write operations.
-    async fn close(&mut self) -> Result<O>;
+    async fn close(self) -> Result<O>;
 }

From 1f7af08e4c750cd57e29e3a24ee217df212034e1 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Tue, 14 Oct 2025 14:05:59 -0700
Subject: [PATCH 07/11] partition key is a must

---
 .../writer/partitioning/clustered_writer.rs   | 178 ++--------
 .../src/writer/partitioning/fanout_writer.rs  | 332 +-----------------
 crates/iceberg/src/writer/partitioning/mod.rs |  10 +-
 3 files changed, 53 insertions(+), 467 deletions(-)

diff --git a/crates/iceberg/src/writer/partitioning/clustered_writer.rs b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
index 52875f72a..8027f076a 100644
--- a/crates/iceberg/src/writer/partitioning/clustered_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
@@ -94,58 +94,45 @@ where
     O: IntoIterator + FromIterator<<O as IntoIterator>::Item> + Send + 'static,
     <O as IntoIterator>::Item: Send + Clone,
 {
-    async fn write(&mut self, partition_key: Option<PartitionKey>, input: I) -> Result<()> {
-        if let Some(partition_key) = partition_key {
-            let partition_value = partition_key.data();
-
-            // Check if this partition has been closed already
-            if self.closed_partitions.contains(partition_value) {
-                return Err(Error::new(
-                    ErrorKind::Unexpected,
-                    format!(
-                        "The input is not sorted! Cannot write to partition that was previously closed: {:?}",
-                        partition_key
-                    ),
-                ));
-            }
+    async fn write(&mut self, partition_key: PartitionKey, input: I) -> Result<()> {
+        let partition_value = partition_key.data();
 
-            // Check if we need to switch to a new partition
-            let need_new_writer = match &self.current_partition {
-                Some(current) => current != partition_value,
-                None => true,
-            };
-
-            if need_new_writer {
-                self.close_current_writer().await?;
-
-                // Create a new writer for the new partition
-                self.current_writer = Some(
-                    self.inner_builder
-                        .clone()
-                        .build_with_partition(Some(partition_key.clone()))
-                        .await?,
-                );
-                self.current_partition = Some(partition_value.clone());
-            }
-        } else if self.current_writer.is_none() {
-            // Unpartitioned data, initialize the writer here
+        // Check if this partition has been closed already
+        if self.closed_partitions.contains(partition_value) {
+            return Err(Error::new(
+                ErrorKind::Unexpected,
+                format!(
+                    "The input is not sorted! Cannot write to partition that was previously closed: {:?}",
+                    partition_key
+                ),
+            ));
+        }
+
+        // Check if we need to switch to a new partition
+        let need_new_writer = match &self.current_partition {
+            Some(current) => current != partition_value,
+            None => true,
+        };
+
+        if need_new_writer {
+            self.close_current_writer().await?;
+
+            // Create a new writer for the new partition
             self.current_writer = Some(
                 self.inner_builder
                     .clone()
-                    .build_with_partition(None)
+                    .build_with_partition(Some(partition_key.clone()))
                     .await?,
             );
+            self.current_partition = Some(partition_value.clone());
         }
 
         // do write
-        if let Some(writer) = &mut self.current_writer {
-            writer.write(input).await
-        } else {
-            Err(Error::new(
-                ErrorKind::Unexpected,
-                "Writer is not initialized!",
-            ))
-        }
+        self.current_writer
+            .as_mut()
+            .expect("Writer should be initialized")
+            .write(input)
+            .await
     }
 
     async fn close(mut self) -> Result<O> {
@@ -177,83 +164,6 @@ mod tests {
     };
     use crate::writer::file_writer::rolling_writer::RollingFileWriterBuilder;
 
-    #[tokio::test]
-    async fn test_clustered_writer_unpartitioned() -> Result<()> {
-        let temp_dir = TempDir::new()?;
-        let file_io = FileIOBuilder::new_fs_io().build()?;
-        let location_gen = DefaultLocationGenerator::with_data_location(
-            temp_dir.path().to_str().unwrap().to_string(),
-        );
-        let file_name_gen =
-            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
-
-        // Create schema
-        let schema = Arc::new(
-            crate::spec::Schema::builder()
-                .with_schema_id(1)
-                .with_fields(vec![
-                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
-                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
-                ])
-                .build()?,
-        );
-
-        // Create writer builder
-        let parquet_writer_builder =
-            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
-
-        // Create rolling file writer builder
-        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
-            parquet_writer_builder,
-            file_io.clone(),
-            location_gen,
-            file_name_gen,
-        );
-
-        // Create data file writer builder
-        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
-
-        // Create clustered writer
-        let mut writer = ClusteredWriter::new(data_file_writer_builder);
-
-        // Create test data with proper field ID metadata
-        let arrow_schema = Schema::new(vec![
-            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                1.to_string(),
-            )])),
-            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                2.to_string(),
-            )])),
-        ]);
-
-        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![1, 2, 3])),
-            Arc::new(StringArray::from(vec!["Alice", "Bob", "Charlie"])),
-        ])?;
-
-        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![4, 5])),
-            Arc::new(StringArray::from(vec!["Dave", "Eve"])),
-        ])?;
-
-        // Write data without partitioning (pass None for partition_key)
-        writer.write(None, batch1).await?;
-        writer.write(None, batch2).await?;
-
-        // Close writer and get data files
-        let data_files = writer.close().await?;
-
-        // Verify at least one file was created
-        assert!(
-            !data_files.is_empty(),
-            "Expected at least one data file to be created"
-        );
-
-        Ok(())
-    }
-
     #[tokio::test]
     async fn test_clustered_writer_single_partition() -> Result<()> {
         let temp_dir = TempDir::new()?;
@@ -331,8 +241,8 @@ mod tests {
         ])?;
 
         // Write data to the same partition (this should work)
-        writer.write(Some(partition_key.clone()), batch1).await?;
-        writer.write(Some(partition_key.clone()), batch2).await?;
+        writer.write(partition_key.clone(), batch1).await?;
+        writer.write(partition_key.clone(), batch2).await?;
 
         // Close writer and get data files
         let data_files = writer.close().await?;
@@ -456,15 +366,9 @@ mod tests {
         ])?;
 
         // Write data in sorted partition order (this should work)
-        writer
-            .write(Some(partition_key_asia.clone()), batch_asia)
-            .await?;
-        writer
-            .write(Some(partition_key_eu.clone()), batch_eu)
-            .await?;
-        writer
-            .write(Some(partition_key_us.clone()), batch_us)
-            .await?;
+        writer.write(partition_key_asia.clone(), batch_asia).await?;
+        writer.write(partition_key_eu.clone(), batch_eu).await?;
+        writer.write(partition_key_us.clone(), batch_us).await?;
 
         // Close writer and get data files
         let data_files = writer.close().await?;
@@ -595,19 +499,13 @@ mod tests {
         ])?;
 
         // Write data to US partition first
-        writer
-            .write(Some(partition_key_us.clone()), batch_us)
-            .await?;
+        writer.write(partition_key_us.clone(), batch_us).await?;
 
         // Write data to EU partition (this closes US partition)
-        writer
-            .write(Some(partition_key_eu.clone()), batch_eu)
-            .await?;
+        writer.write(partition_key_eu.clone(), batch_eu).await?;
 
         // Try to write to US partition again - this should fail because data is not sorted
-        let result = writer
-            .write(Some(partition_key_us.clone()), batch_us2)
-            .await;
+        let result = writer.write(partition_key_us.clone(), batch_us2).await;
 
         assert!(result.is_err(), "Expected error when writing unsorted data");
 
diff --git a/crates/iceberg/src/writer/partitioning/fanout_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
index 3a7dca810..9c27b0312 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
@@ -48,7 +48,6 @@ where
 {
     inner_builder: B,
     partition_writers: HashMap<Struct, B::R>,
-    unpartitioned_writer: Option<B::R>,
     output: Vec<<O as IntoIterator>::Item>,
     _phantom: PhantomData<I>,
 }
@@ -65,17 +64,13 @@ where
         Self {
             inner_builder,
             partition_writers: HashMap::new(),
-            unpartitioned_writer: None,
             output: Vec::new(),
             _phantom: PhantomData,
         }
     }
 
     /// Get or create a writer for the specified partition.
-    async fn get_or_create_partition_writer(
-        &mut self,
-        partition_key: &PartitionKey,
-    ) -> Result<&mut B::R> {
+    async fn get_or_create_writer(&mut self, partition_key: &PartitionKey) -> Result<&mut B::R> {
         if !self.partition_writers.contains_key(partition_key.data()) {
             let writer = self
                 .inner_builder
@@ -95,25 +90,6 @@ where
                 )
             })
     }
-
-    /// Get or create the unpartitioned writer.
-    async fn get_or_create_unpartitioned_writer(&mut self) -> Result<&mut B::R> {
-        if self.unpartitioned_writer.is_none() {
-            self.unpartitioned_writer = Some(
-                self.inner_builder
-                    .clone()
-                    .build_with_partition(None)
-                    .await?,
-            );
-        }
-
-        self.unpartitioned_writer.as_mut().ok_or_else(|| {
-            Error::new(
-                ErrorKind::Unexpected,
-                "Failed to get unpartitioned writer after creation",
-            )
-        })
-    }
 }
 
 #[async_trait]
@@ -124,14 +100,9 @@ where
     O: IntoIterator + FromIterator<<O as IntoIterator>::Item> + Send + 'static,
     <O as IntoIterator>::Item: Send + Clone,
 {
-    async fn write(&mut self, partition_key: Option<PartitionKey>, input: I) -> Result<()> {
-        if let Some(partition_key) = partition_key {
-            let writer = self.get_or_create_partition_writer(&partition_key).await?;
-            writer.write(input).await
-        } else {
-            let writer = self.get_or_create_unpartitioned_writer().await?;
-            writer.write(input).await
-        }
+    async fn write(&mut self, partition_key: PartitionKey, input: I) -> Result<()> {
+        let writer = self.get_or_create_writer(&partition_key).await?;
+        writer.write(input).await
     }
 
     async fn close(mut self) -> Result<O> {
@@ -140,11 +111,6 @@ where
             self.output.extend(writer.close().await?);
         }
 
-        // Close unpartitioned writer if it exists
-        if let Some(mut writer) = self.unpartitioned_writer {
-            self.output.extend(writer.close().await?);
-        }
-
         // Collect all output items into the output collection type
         Ok(O::from_iter(self.output))
     }
@@ -174,167 +140,6 @@ mod tests {
     };
     use crate::writer::file_writer::rolling_writer::RollingFileWriterBuilder;
 
-    #[tokio::test]
-    async fn test_fanout_writer_unpartitioned() -> Result<()> {
-        let temp_dir = TempDir::new()?;
-        let file_io = FileIOBuilder::new_fs_io().build()?;
-        let location_gen = DefaultLocationGenerator::with_data_location(
-            temp_dir.path().to_str().unwrap().to_string(),
-        );
-        let file_name_gen =
-            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
-
-        // Create schema
-        let schema = Arc::new(
-            crate::spec::Schema::builder()
-                .with_schema_id(1)
-                .with_fields(vec![
-                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
-                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
-                ])
-                .build()?,
-        );
-
-        // Create writer builder
-        let parquet_writer_builder =
-            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
-
-        // Create rolling file writer builder
-        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
-            parquet_writer_builder,
-            file_io.clone(),
-            location_gen,
-            file_name_gen,
-        );
-
-        // Create data file writer builder
-        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
-
-        // Create fanout writer
-        let mut writer = FanoutWriter::new(data_file_writer_builder);
-
-        // Create test data with proper field ID metadata
-        let arrow_schema = Schema::new(vec![
-            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                1.to_string(),
-            )])),
-            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                2.to_string(),
-            )])),
-        ]);
-
-        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![1, 2, 3])),
-            Arc::new(StringArray::from(vec!["Alice", "Bob", "Charlie"])),
-        ])?;
-
-        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![4, 5])),
-            Arc::new(StringArray::from(vec!["Dave", "Eve"])),
-        ])?;
-
-        // Write data without partitioning (pass None for partition_key)
-        writer.write(None, batch1).await?;
-        writer.write(None, batch2).await?;
-
-        // Close writer and get data files
-        let data_files = writer.close().await?;
-
-        // Verify at least one file was created
-        assert!(
-            !data_files.is_empty(),
-            "Expected at least one data file to be created"
-        );
-
-        Ok(())
-    }
-
-    #[tokio::test]
-    async fn test_fanout_writer_multiple_writes() -> Result<()> {
-        let temp_dir = TempDir::new()?;
-        let file_io = FileIOBuilder::new_fs_io().build()?;
-        let location_gen = DefaultLocationGenerator::with_data_location(
-            temp_dir.path().to_str().unwrap().to_string(),
-        );
-        let file_name_gen =
-            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
-
-        // Create schema
-        let schema = Arc::new(
-            crate::spec::Schema::builder()
-                .with_schema_id(1)
-                .with_fields(vec![
-                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
-                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
-                ])
-                .build()?,
-        );
-
-        // Create writer builder
-        let parquet_writer_builder =
-            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
-
-        // Create rolling file writer builder
-        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
-            parquet_writer_builder,
-            file_io.clone(),
-            location_gen,
-            file_name_gen,
-        );
-
-        // Create data file writer builder
-        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
-
-        // Create fanout writer
-        let mut writer = FanoutWriter::new(data_file_writer_builder);
-
-        // Create test data with proper field ID metadata
-        let arrow_schema = Schema::new(vec![
-            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                1.to_string(),
-            )])),
-            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                2.to_string(),
-            )])),
-        ]);
-
-        let batch1 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![1, 2])),
-            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
-        ])?;
-
-        let batch2 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![3, 4])),
-            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
-        ])?;
-
-        let batch3 = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![5])),
-            Arc::new(StringArray::from(vec!["Eve"])),
-        ])?;
-
-        // Write multiple batches to demonstrate fanout capability
-        // (all unpartitioned for simplicity)
-        writer.write(None, batch1).await?;
-        writer.write(None, batch2).await?;
-        writer.write(None, batch3).await?;
-
-        // Close writer and get data files
-        let data_files = writer.close().await?;
-
-        // Verify at least one file was created
-        assert!(
-            !data_files.is_empty(),
-            "Expected at least one data file to be created"
-        );
-
-        Ok(())
-    }
-
     #[tokio::test]
     async fn test_fanout_writer_single_partition() -> Result<()> {
         let temp_dir = TempDir::new()?;
@@ -411,8 +216,8 @@ mod tests {
         ])?;
 
         // Write data to the same partition
-        writer.write(Some(partition_key.clone()), batch1).await?;
-        writer.write(Some(partition_key.clone()), batch2).await?;
+        writer.write(partition_key.clone(), batch1).await?;
+        writer.write(partition_key.clone(), batch2).await?;
 
         // Close writer and get data files
         let data_files = writer.close().await?;
@@ -540,18 +345,10 @@ mod tests {
 
         // Write data in mixed partition order to demonstrate fanout capability
         // This is the key difference from ClusteredWriter - we can write to any partition at any time
-        writer
-            .write(Some(partition_key_us.clone()), batch_us1)
-            .await?;
-        writer
-            .write(Some(partition_key_eu.clone()), batch_eu1)
-            .await?;
-        writer
-            .write(Some(partition_key_us.clone()), batch_us2)
-            .await?; // Back to US partition
-        writer
-            .write(Some(partition_key_asia.clone()), batch_asia1)
-            .await?;
+        writer.write(partition_key_us.clone(), batch_us1).await?;
+        writer.write(partition_key_eu.clone(), batch_eu1).await?;
+        writer.write(partition_key_us.clone(), batch_us2).await?; // Back to US partition
+        writer.write(partition_key_asia.clone(), batch_asia1).await?;
 
         // Close writer and get data files
         let data_files = writer.close().await?;
@@ -585,113 +382,4 @@ mod tests {
         Ok(())
     }
 
-    #[tokio::test]
-    async fn test_fanout_writer_mixed_partitioned_unpartitioned() -> Result<()> {
-        let temp_dir = TempDir::new()?;
-        let file_io = FileIOBuilder::new_fs_io().build()?;
-        let location_gen = DefaultLocationGenerator::with_data_location(
-            temp_dir.path().to_str().unwrap().to_string(),
-        );
-        let file_name_gen =
-            DefaultFileNameGenerator::new("test".to_string(), None, DataFileFormat::Parquet);
-
-        // Create schema
-        let schema = Arc::new(
-            crate::spec::Schema::builder()
-                .with_schema_id(1)
-                .with_fields(vec![
-                    NestedField::required(1, "id", Type::Primitive(PrimitiveType::Int)).into(),
-                    NestedField::required(2, "name", Type::Primitive(PrimitiveType::String)).into(),
-                    NestedField::required(3, "region", Type::Primitive(PrimitiveType::String))
-                        .into(),
-                ])
-                .build()?,
-        );
-
-        // Create partition spec and key
-        let partition_spec = PartitionSpec::builder(schema.clone()).build()?;
-        let partition_value_us = Struct::from_iter([Some(Literal::string("US"))]);
-        let partition_key_us =
-            PartitionKey::new(partition_spec, schema.clone(), partition_value_us.clone());
-
-        // Create writer builder
-        let parquet_writer_builder =
-            ParquetWriterBuilder::new(WriterProperties::builder().build(), schema.clone());
-
-        // Create rolling file writer builder
-        let rolling_writer_builder = RollingFileWriterBuilder::new_with_default_file_size(
-            parquet_writer_builder,
-            file_io.clone(),
-            location_gen,
-            file_name_gen,
-        );
-
-        // Create data file writer builder
-        let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
-
-        // Create fanout writer
-        let mut writer = FanoutWriter::new(data_file_writer_builder);
-
-        // Create test data with proper field ID metadata
-        let arrow_schema = Schema::new(vec![
-            Field::new("id", DataType::Int32, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                1.to_string(),
-            )])),
-            Field::new("name", DataType::Utf8, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                2.to_string(),
-            )])),
-            Field::new("region", DataType::Utf8, false).with_metadata(HashMap::from([(
-                PARQUET_FIELD_ID_META_KEY.to_string(),
-                3.to_string(),
-            )])),
-        ]);
-
-        // Create batches
-        let batch_partitioned = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![1, 2])),
-            Arc::new(StringArray::from(vec!["Alice", "Bob"])),
-            Arc::new(StringArray::from(vec!["US", "US"])),
-        ])?;
-
-        let batch_unpartitioned = RecordBatch::try_new(Arc::new(arrow_schema.clone()), vec![
-            Arc::new(Int32Array::from(vec![3, 4])),
-            Arc::new(StringArray::from(vec!["Charlie", "Dave"])),
-            Arc::new(StringArray::from(vec!["UNKNOWN", "UNKNOWN"])),
-        ])?;
-
-        // Write both partitioned and unpartitioned data
-        writer
-            .write(Some(partition_key_us), batch_partitioned)
-            .await?;
-        writer.write(None, batch_unpartitioned).await?;
-
-        // Close writer and get data files
-        let data_files = writer.close().await?;
-
-        // Verify files were created for both partitioned and unpartitioned data
-        assert!(
-            data_files.len() >= 2,
-            "Expected at least 2 data files (partitioned + unpartitioned), got {}",
-            data_files.len()
-        );
-
-        // Verify we have both partitioned and unpartitioned files
-        let mut has_partitioned = false;
-        let mut has_unpartitioned = false;
-
-        for data_file in &data_files {
-            if data_file.partition == partition_value_us {
-                has_partitioned = true;
-            } else if data_file.partition == Struct::empty() {
-                has_unpartitioned = true;
-            }
-        }
-
-        assert!(has_partitioned, "Missing partitioned data file");
-        assert!(has_unpartitioned, "Missing unpartitioned data file");
-
-        Ok(())
-    }
 }
diff --git a/crates/iceberg/src/writer/partitioning/mod.rs b/crates/iceberg/src/writer/partitioning/mod.rs
index d34717c25..2c4fcb7e5 100644
--- a/crates/iceberg/src/writer/partitioning/mod.rs
+++ b/crates/iceberg/src/writer/partitioning/mod.rs
@@ -18,27 +18,27 @@
 pub mod clustered_writer;
 pub mod fanout_writer;
 
-use crate::Result;
 use crate::spec::PartitionKey;
 use crate::writer::{DefaultInput, DefaultOutput};
+use crate::Result;
 
 /// A writer that can write data to partitioned tables.
 ///
-/// This trait provides methods for writing data with optional partition keys and
+/// This trait provides methods for writing data with partition keys and
 /// closing the writer to retrieve the output.
 #[async_trait::async_trait]
 pub trait PartitioningWriter<I = DefaultInput, O = DefaultOutput>: Send + 'static {
-    /// Write data with an optional partition key.
+    /// Write data with a partition key.
     ///
     /// # Parameters
     ///
-    /// * `partition_key` - Optional partition key to determine which partition to write to
+    /// * `partition_key` - Partition key to determine which partition to write to
     /// * `input` - The input data to write
     ///
     /// # Returns
     ///
     /// `Ok(())` on success, or an error if the write operation fails.
-    async fn write(&mut self, partition_key: Option<PartitionKey>, input: I) -> Result<()>;
+    async fn write(&mut self, partition_key: PartitionKey, input: I) -> Result<()>;
 
     /// Close the writer and return the output.
     ///

From ff77897a182aa29c413430d576f821286f297f24 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Tue, 14 Oct 2025 14:15:21 -0700
Subject: [PATCH 08/11] rename build_with_partition to build

---
 .../src/writer/base_writer/data_file_writer.rs      |  6 +++---
 .../writer/base_writer/equality_delete_writer.rs    |  6 +++---
 .../src/writer/file_writer/rolling_writer.rs        |  4 ++--
 crates/iceberg/src/writer/mod.rs                    | 13 +++++--------
 .../src/writer/partitioning/clustered_writer.rs     |  2 +-
 .../src/writer/partitioning/fanout_writer.rs        |  2 +-
 .../tests/shared_tests/append_data_file_test.rs     |  2 +-
 .../shared_tests/append_partition_data_file_test.rs |  6 +++---
 .../tests/shared_tests/conflict_commit_test.rs      |  2 +-
 .../tests/shared_tests/scan_all_type.rs             |  2 +-
 .../datafusion/src/physical_plan/write.rs           |  2 +-
 11 files changed, 22 insertions(+), 25 deletions(-)

diff --git a/crates/iceberg/src/writer/base_writer/data_file_writer.rs b/crates/iceberg/src/writer/base_writer/data_file_writer.rs
index 5de93f98f..b9de4efda 100644
--- a/crates/iceberg/src/writer/base_writer/data_file_writer.rs
+++ b/crates/iceberg/src/writer/base_writer/data_file_writer.rs
@@ -53,7 +53,7 @@ where
 {
     type R = DataFileWriter<B, L, F>;
 
-    async fn build_with_partition(self, partition_key: Option<PartitionKey>) -> Result<Self::R> {
+    async fn build(self, partition_key: Option<PartitionKey>) -> Result<Self::R> {
         Ok(DataFileWriter {
             inner: Some(self.inner.clone().build()),
             partition_key,
@@ -188,7 +188,7 @@ mod test {
         );
 
         let mut data_file_writer = DataFileWriterBuilder::new(rolling_file_writer_builder)
-            .build_with_partition(None)
+            .build(None)
             .await
             .unwrap();
 
@@ -274,7 +274,7 @@ mod test {
         );
 
         let mut data_file_writer = DataFileWriterBuilder::new(rolling_file_writer_builder)
-            .build_with_partition(Some(partition_key))
+            .build(Some(partition_key))
             .await?;
 
         let arrow_schema = arrow_schema::Schema::new(vec![
diff --git a/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs b/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs
index 1d3bcc7db..bd96c80bb 100644
--- a/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs
+++ b/crates/iceberg/src/writer/base_writer/equality_delete_writer.rs
@@ -123,7 +123,7 @@ where
 {
     type R = EqualityDeleteFileWriter<B, L, F>;
 
-    async fn build_with_partition(self, partition_key: Option<PartitionKey>) -> Result<Self::R> {
+    async fn build(self, partition_key: Option<PartitionKey>) -> Result<Self::R> {
         Ok(EqualityDeleteFileWriter {
             inner: Some(self.inner.clone().build()),
             projector: self.config.projector,
@@ -438,7 +438,7 @@ mod test {
         );
         let mut equality_delete_writer =
             EqualityDeleteFileWriterBuilder::new(rolling_writer_builder, equality_config)
-                .build_with_partition(None)
+                .build(None)
                 .await?;
 
         // write
@@ -605,7 +605,7 @@ mod test {
         );
         let mut equality_delete_writer =
             EqualityDeleteFileWriterBuilder::new(rolling_writer_builder, config)
-                .build_with_partition(None)
+                .build(None)
                 .await?;
 
         // prepare data
diff --git a/crates/iceberg/src/writer/file_writer/rolling_writer.rs b/crates/iceberg/src/writer/file_writer/rolling_writer.rs
index 0ffd48b39..73753d6bf 100644
--- a/crates/iceberg/src/writer/file_writer/rolling_writer.rs
+++ b/crates/iceberg/src/writer/file_writer/rolling_writer.rs
@@ -332,7 +332,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
 
         // Create writer
-        let mut writer = data_file_writer_builder.build_with_partition(None).await?;
+        let mut writer = data_file_writer_builder.build(None).await?;
 
         // Create test data
         let arrow_schema = make_test_arrow_schema();
@@ -390,7 +390,7 @@ mod tests {
         let data_file_writer_builder = DataFileWriterBuilder::new(rolling_writer_builder);
 
         // Create writer
-        let mut writer = data_file_writer_builder.build_with_partition(None).await?;
+        let mut writer = data_file_writer_builder.build(None).await?;
 
         // Create test data
         let arrow_schema = make_test_arrow_schema();
diff --git a/crates/iceberg/src/writer/mod.rs b/crates/iceberg/src/writer/mod.rs
index 1427fcac7..a48c6db1c 100644
--- a/crates/iceberg/src/writer/mod.rs
+++ b/crates/iceberg/src/writer/mod.rs
@@ -102,7 +102,7 @@
 //!     // Create a data file writer using parquet file writer builder.
 //!     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
 //!     // Build the data file writer
-//!     let mut data_file_writer = data_file_writer_builder.build_with_partition(None).await?;
+//!     let mut data_file_writer = data_file_writer_builder.build(None).await?;
 //!
 //!     // Write the data using data_file_writer...
 //!
@@ -153,10 +153,7 @@
 //!         partition_key: Option<PartitionKey>,
 //!     ) -> Result<Self::R> {
 //!         Ok(LatencyRecordWriter {
-//!             inner_writer: self
-//!                 .inner_writer_builder
-//!                 .build_with_partition(partition_key)
-//!                 .await?,
+//!             inner_writer: self.inner_writer_builder.build(partition_key).await?,
 //!         })
 //!     }
 //! }
@@ -241,7 +238,7 @@
 //!     let latency_record_builder = LatencyRecordWriterBuilder::new(data_file_writer_builder);
 //!     // Build the final writer
 //!     let mut latency_record_data_file_writer = latency_record_builder
-//!         .build_with_partition(Some(partition_key))
+//!         .build(Some(partition_key))
 //!         .await
 //!         .unwrap();
 //!
@@ -270,8 +267,8 @@ pub trait IcebergWriterBuilder<I = DefaultInput, O = DefaultOutput>:
 {
     /// The associated writer type.
     type R: IcebergWriter<I, O>;
-    /// Build the iceberg writer for an optional partition key.
-    async fn build_with_partition(self, partition_key: Option<PartitionKey>) -> Result<Self::R>;
+    /// Build the iceberg writer with an optional partition key.
+    async fn build(self, partition_key: Option<PartitionKey>) -> Result<Self::R>;
 }
 
 /// The iceberg writer used to write data to iceberg table.
diff --git a/crates/iceberg/src/writer/partitioning/clustered_writer.rs b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
index 8027f076a..c9a23bde2 100644
--- a/crates/iceberg/src/writer/partitioning/clustered_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
@@ -121,7 +121,7 @@ where
             self.current_writer = Some(
                 self.inner_builder
                     .clone()
-                    .build_with_partition(Some(partition_key.clone()))
+                    .build(Some(partition_key.clone()))
                     .await?,
             );
             self.current_partition = Some(partition_value.clone());
diff --git a/crates/iceberg/src/writer/partitioning/fanout_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
index 9c27b0312..7d5a8456a 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
@@ -75,7 +75,7 @@ where
             let writer = self
                 .inner_builder
                 .clone()
-                .build_with_partition(Some(partition_key.clone()))
+                .build(Some(partition_key.clone()))
                 .await?;
             self.partition_writers
                 .insert(partition_key.data().clone(), writer);
diff --git a/crates/integration_tests/tests/shared_tests/append_data_file_test.rs b/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
index 4488dfff7..19d211e8e 100644
--- a/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
+++ b/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
@@ -84,7 +84,7 @@ async fn test_append_data_file() {
     );
     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
     let mut data_file_writer = data_file_writer_builder
-        .build_with_partition(None)
+        .build(None)
         .await
         .unwrap();
     let col1 = StringArray::from(vec![Some("foo"), Some("bar"), None, Some("baz")]);
diff --git a/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs b/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs
index 47080e2e1..a305ec084 100644
--- a/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs
+++ b/crates/integration_tests/tests/shared_tests/append_partition_data_file_test.rs
@@ -108,7 +108,7 @@ async fn test_append_partition_data_file() {
 
     let mut data_file_writer_valid =
         DataFileWriterBuilder::new(rolling_file_writer_builder.clone())
-            .build_with_partition(Some(partition_key.clone()))
+            .build(Some(partition_key.clone()))
             .await
             .unwrap();
 
@@ -190,7 +190,7 @@ async fn test_schema_incompatible_partition_type(
 ) {
     // test writing different "type" of partition than mentioned in schema
     let mut data_file_writer_invalid = DataFileWriterBuilder::new(rolling_file_writer_builder)
-        .build_with_partition(Some(partition_key))
+        .build(Some(partition_key))
         .await
         .unwrap();
 
@@ -219,7 +219,7 @@ async fn test_schema_incompatible_partition_fields(
 ) {
     // test writing different number of partition fields than mentioned in schema
     let mut data_file_writer_invalid = DataFileWriterBuilder::new(rolling_file_writer_builder)
-        .build_with_partition(Some(partition_key))
+        .build(Some(partition_key))
         .await
         .unwrap();
 
diff --git a/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs b/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
index bc37ce2a2..6019d88ea 100644
--- a/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
+++ b/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
@@ -83,7 +83,7 @@ async fn test_append_data_file_conflict() {
     );
     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
     let mut data_file_writer = data_file_writer_builder
-        .build_with_partition(None)
+        .build(None)
         .await
         .unwrap();
     let col1 = StringArray::from(vec![Some("foo"), Some("bar"), None, Some("baz")]);
diff --git a/crates/integration_tests/tests/shared_tests/scan_all_type.rs b/crates/integration_tests/tests/shared_tests/scan_all_type.rs
index 870f7ef92..a46026f87 100644
--- a/crates/integration_tests/tests/shared_tests/scan_all_type.rs
+++ b/crates/integration_tests/tests/shared_tests/scan_all_type.rs
@@ -165,7 +165,7 @@ async fn test_scan_all_type() {
     );
     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
     let mut data_file_writer = data_file_writer_builder
-        .build_with_partition(None)
+        .build(None)
         .await
         .unwrap();
 
diff --git a/crates/integrations/datafusion/src/physical_plan/write.rs b/crates/integrations/datafusion/src/physical_plan/write.rs
index 1b66a9a6b..eec08c6d2 100644
--- a/crates/integrations/datafusion/src/physical_plan/write.rs
+++ b/crates/integrations/datafusion/src/physical_plan/write.rs
@@ -296,7 +296,7 @@ impl ExecutionPlan for IcebergWriteExec {
         let stream = futures::stream::once(async move {
             let mut writer = data_file_writer_builder
                 // todo specify partition key when partitioning writer is supported
-                .build_with_partition(None)
+                .build(None)
                 .await
                 .map_err(to_datafusion_error)?;
             let mut input_stream = data;

From 49f7197f9885c90ec8f5a49cae835cd01781840e Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Tue, 14 Oct 2025 14:16:10 -0700
Subject: [PATCH 09/11] daily fmt fix

---
 crates/iceberg/src/writer/partitioning/fanout_writer.rs      | 5 +++--
 crates/iceberg/src/writer/partitioning/mod.rs                | 2 +-
 .../tests/shared_tests/append_data_file_test.rs              | 5 +----
 .../tests/shared_tests/conflict_commit_test.rs               | 5 +----
 crates/integration_tests/tests/shared_tests/scan_all_type.rs | 5 +----
 5 files changed, 7 insertions(+), 15 deletions(-)

diff --git a/crates/iceberg/src/writer/partitioning/fanout_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
index 7d5a8456a..eeae06326 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
@@ -348,7 +348,9 @@ mod tests {
         writer.write(partition_key_us.clone(), batch_us1).await?;
         writer.write(partition_key_eu.clone(), batch_eu1).await?;
         writer.write(partition_key_us.clone(), batch_us2).await?; // Back to US partition
-        writer.write(partition_key_asia.clone(), batch_asia1).await?;
+        writer
+            .write(partition_key_asia.clone(), batch_asia1)
+            .await?;
 
         // Close writer and get data files
         let data_files = writer.close().await?;
@@ -381,5 +383,4 @@ mod tests {
 
         Ok(())
     }
-
 }
diff --git a/crates/iceberg/src/writer/partitioning/mod.rs b/crates/iceberg/src/writer/partitioning/mod.rs
index 2c4fcb7e5..7964c533c 100644
--- a/crates/iceberg/src/writer/partitioning/mod.rs
+++ b/crates/iceberg/src/writer/partitioning/mod.rs
@@ -18,9 +18,9 @@
 pub mod clustered_writer;
 pub mod fanout_writer;
 
+use crate::Result;
 use crate::spec::PartitionKey;
 use crate::writer::{DefaultInput, DefaultOutput};
-use crate::Result;
 
 /// A writer that can write data to partitioned tables.
 ///
diff --git a/crates/integration_tests/tests/shared_tests/append_data_file_test.rs b/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
index 19d211e8e..bedc97510 100644
--- a/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
+++ b/crates/integration_tests/tests/shared_tests/append_data_file_test.rs
@@ -83,10 +83,7 @@ async fn test_append_data_file() {
         file_name_generator.clone(),
     );
     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
-    let mut data_file_writer = data_file_writer_builder
-        .build(None)
-        .await
-        .unwrap();
+    let mut data_file_writer = data_file_writer_builder.build(None).await.unwrap();
     let col1 = StringArray::from(vec![Some("foo"), Some("bar"), None, Some("baz")]);
     let col2 = Int32Array::from(vec![Some(1), Some(2), Some(3), Some(4)]);
     let col3 = BooleanArray::from(vec![Some(true), Some(false), None, Some(false)]);
diff --git a/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs b/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
index 6019d88ea..fc529cc3d 100644
--- a/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
+++ b/crates/integration_tests/tests/shared_tests/conflict_commit_test.rs
@@ -82,10 +82,7 @@ async fn test_append_data_file_conflict() {
         file_name_generator.clone(),
     );
     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
-    let mut data_file_writer = data_file_writer_builder
-        .build(None)
-        .await
-        .unwrap();
+    let mut data_file_writer = data_file_writer_builder.build(None).await.unwrap();
     let col1 = StringArray::from(vec![Some("foo"), Some("bar"), None, Some("baz")]);
     let col2 = Int32Array::from(vec![Some(1), Some(2), Some(3), Some(4)]);
     let col3 = BooleanArray::from(vec![Some(true), Some(false), None, Some(false)]);
diff --git a/crates/integration_tests/tests/shared_tests/scan_all_type.rs b/crates/integration_tests/tests/shared_tests/scan_all_type.rs
index a46026f87..7a2907d4c 100644
--- a/crates/integration_tests/tests/shared_tests/scan_all_type.rs
+++ b/crates/integration_tests/tests/shared_tests/scan_all_type.rs
@@ -164,10 +164,7 @@ async fn test_scan_all_type() {
         file_name_generator.clone(),
     );
     let data_file_writer_builder = DataFileWriterBuilder::new(rolling_file_writer_builder);
-    let mut data_file_writer = data_file_writer_builder
-        .build(None)
-        .await
-        .unwrap();
+    let mut data_file_writer = data_file_writer_builder.build(None).await.unwrap();
 
     // Prepare data
     let col1 = Int32Array::from(vec![1, 2, 3, 4, 5]);

From 549d10d0f2f4136a0fec7e0f13cdb3fc99d53e67 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Tue, 14 Oct 2025 14:33:33 -0700
Subject: [PATCH 10/11] fix doc

---
 crates/iceberg/src/writer/mod.rs | 5 +----
 1 file changed, 1 insertion(+), 4 deletions(-)

diff --git a/crates/iceberg/src/writer/mod.rs b/crates/iceberg/src/writer/mod.rs
index a48c6db1c..1da3fa679 100644
--- a/crates/iceberg/src/writer/mod.rs
+++ b/crates/iceberg/src/writer/mod.rs
@@ -148,10 +148,7 @@
 //! impl<B: IcebergWriterBuilder> IcebergWriterBuilder for LatencyRecordWriterBuilder<B> {
 //!     type R = LatencyRecordWriter<B::R>;
 //!
-//!     async fn build_with_partition(
-//!         self,
-//!         partition_key: Option<PartitionKey>,
-//!     ) -> Result<Self::R> {
+//!     async fn build(self, partition_key: Option<PartitionKey>) -> Result<Self::R> {
 //!         Ok(LatencyRecordWriter {
 //!             inner_writer: self.inner_writer_builder.build(partition_key).await?,
 //!         })

From 484c6491a3abe805f79b90fbc36de341053f9dc5 Mon Sep 17 00:00:00 2001
From: Shawn Chang <yxchang@amazon.com>
Date: Wed, 15 Oct 2025 11:43:09 -0700
Subject: [PATCH 11/11] remove clone from fanout and clustered writer

---
 crates/iceberg/src/writer/partitioning/clustered_writer.rs | 1 -
 crates/iceberg/src/writer/partitioning/fanout_writer.rs    | 1 -
 crates/iceberg/src/writer/partitioning/mod.rs              | 2 --
 3 files changed, 4 deletions(-)

diff --git a/crates/iceberg/src/writer/partitioning/clustered_writer.rs b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
index c9a23bde2..c141b212f 100644
--- a/crates/iceberg/src/writer/partitioning/clustered_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/clustered_writer.rs
@@ -37,7 +37,6 @@ use crate::{Error, ErrorKind, Result};
 /// * `B` - The inner writer builder type
 /// * `I` - Input type (defaults to `RecordBatch`)
 /// * `O` - Output collection type (defaults to `Vec<DataFile>`)
-#[derive(Clone)]
 pub struct ClusteredWriter<B, I = DefaultInput, O = DefaultOutput>
 where
     B: IcebergWriterBuilder<I, O>,
diff --git a/crates/iceberg/src/writer/partitioning/fanout_writer.rs b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
index eeae06326..796c1a488 100644
--- a/crates/iceberg/src/writer/partitioning/fanout_writer.rs
+++ b/crates/iceberg/src/writer/partitioning/fanout_writer.rs
@@ -39,7 +39,6 @@ use crate::{Error, ErrorKind, Result};
 /// * `B` - The inner writer builder type
 /// * `I` - Input type (defaults to `RecordBatch`)
 /// * `O` - Output collection type (defaults to `Vec<DataFile>`)
-#[derive(Clone)]
 pub struct FanoutWriter<B, I = DefaultInput, O = DefaultOutput>
 where
     B: IcebergWriterBuilder<I, O>,
diff --git a/crates/iceberg/src/writer/partitioning/mod.rs b/crates/iceberg/src/writer/partitioning/mod.rs
index 7964c533c..36acb2a98 100644
--- a/crates/iceberg/src/writer/partitioning/mod.rs
+++ b/crates/iceberg/src/writer/partitioning/mod.rs
@@ -42,8 +42,6 @@ pub trait PartitioningWriter<I = DefaultInput, O = DefaultOutput>: Send + 'stati
 
     /// Close the writer and return the output.
     ///
-    /// This method consumes the writer, preventing further use after closing.
-    ///
     /// # Returns
     ///
     /// The accumulated output from all write operations.