apache · kerwin-zk · Sep 23, 2025 · Zouxxyy · Sep 25, 2025
diff --git a/paimon-spark/paimon-spark-3.4/src/test/scala/org/apache/paimon/spark/PaimonSinkTest.scala b/paimon-spark/paimon-spark-3.4/src/test/scala/org/apache/paimon/spark/PaimonSinkTest.scala
@@ -29,51 +29,55 @@ import java.sql.Date
 class PaimonSinkTest extends PaimonSparkTestBase with StreamTest {
 
   override protected def sparkConf: SparkConf = {
-    super.sparkConf.set("spark.sql.catalog.paimon.cache-enabled", "false")
+    super.sparkConf
+      .set("spark.sql.catalog.paimon.cache-enabled", "false")
+      .set("spark.paimon.write.use-v2-write", "false")
   }
 
   import testImplicits._
 
   test("Paimon Sink: forEachBatch") {
-    failAfter(streamingTimeout) {
-      withTempDir {
-        checkpointDir =>
-          // define a pk table and test `forEachBatch` api
-          spark.sql(s"""
-                       |CREATE TABLE T (a INT, b STRING)
-                       |TBLPROPERTIES ('primary-key'='a', 'bucket'='3')
-                       |""".stripMargin)
-          val location = loadTable("T").location().toString
-
-          val inputData = MemoryStream[(Int, String)]
-          val stream = inputData
-            .toDS()
-            .toDF("a", "b")
-            .writeStream
-            .option("checkpointLocation", checkpointDir.getCanonicalPath)
-            .foreachBatch {
-              (batch: Dataset[Row], id: Long) =>
-                batch.write.format("paimon").mode("append").save(location)
+    withSparkSQLConf(("spark.paimon.write.use-v2-write", "false")) {
+      failAfter(streamingTimeout) {
+        withTempDir {
+          checkpointDir =>
+            // define a pk table and test `forEachBatch` api
+            spark.sql(s"""
+                         |CREATE TABLE T (a INT, b STRING)
+                         |TBLPROPERTIES ('primary-key'='a', 'bucket'='3')
+                         |""".stripMargin)
+            val location = loadTable("T").location().toString
+
+            val inputData = MemoryStream[(Int, String)]
+            val stream = inputData
+              .toDS()
+              .toDF("a", "b")
+              .writeStream
+              .option("checkpointLocation", checkpointDir.getCanonicalPath)
+              .foreachBatch {
+                (batch: Dataset[Row], id: Long) =>
+                  batch.write.format("paimon").mode("append").save(location)
+              }
+              .start()
+
+            val query = () => spark.sql("SELECT * FROM T ORDER BY a")
+
+            try {
+              inputData.addData((1, "a"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Nil)
+
+              inputData.addData((2, "b"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Row(2, "b") :: Nil)
+
+              inputData.addData((2, "b2"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Row(2, "b2") :: Nil)
+            } finally {
+              stream.stop()
             }
-            .start()
-
-          val query = () => spark.sql("SELECT * FROM T ORDER BY a")
-
-          try {
-            inputData.addData((1, "a"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Nil)
-
-            inputData.addData((2, "b"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Row(2, "b") :: Nil)
-
-            inputData.addData((2, "b2"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Row(2, "b2") :: Nil)
-          } finally {
-            stream.stop()
-          }
+        }
       }
     }
   }

diff --git a/...park-3.4/src/test/scala/org/apache/paimon/spark/sql/CreateAndDeleteTagProcedureTest.scala b/...park-3.4/src/test/scala/org/apache/paimon/spark/sql/CreateAndDeleteTagProcedureTest.scala
@@ -29,107 +29,109 @@ class CreateAndDeleteTagProcedureTest extends PaimonSparkTestBase with StreamTes
   import testImplicits._
 
   test("Paimon Procedure: create and delete tag") {
-    failAfter(streamingTimeout) {
-      withTempDir {
-        checkpointDir =>
-          // define a pk table and test `forEachBatch` api
-          spark.sql(s"""
-                       |CREATE TABLE T (a INT, b STRING)
-                       |TBLPROPERTIES ('primary-key'='a', 'bucket'='3')
-                       |""".stripMargin)
-          val location = loadTable("T").location().toString
-
-          val inputData = MemoryStream[(Int, String)]
-          val stream = inputData
-            .toDS()
-            .toDF("a", "b")
-            .writeStream
-            .option("checkpointLocation", checkpointDir.getCanonicalPath)
-            .foreachBatch {
-              (batch: Dataset[Row], _: Long) =>
-                batch.write.format("paimon").mode("append").save(location)
+    withSparkSQLConf(("spark.paimon.write.use-v2-write", "false")) {
+      failAfter(streamingTimeout) {
+        withTempDir {
+          checkpointDir =>
+            // define a pk table and test `forEachBatch` api
+            spark.sql(s"""
+                         |CREATE TABLE T (a INT, b STRING)
+                         |TBLPROPERTIES ('primary-key'='a', 'bucket'='3')
+                         |""".stripMargin)
+            val location = loadTable("T").location().toString
+
+            val inputData = MemoryStream[(Int, String)]
+            val stream = inputData
+              .toDS()
+              .toDF("a", "b")
+              .writeStream
+              .option("checkpointLocation", checkpointDir.getCanonicalPath)
+              .foreachBatch {
+                (batch: Dataset[Row], _: Long) =>
+                  batch.write.format("paimon").mode("append").save(location)
+              }
+              .start()
+
+            val query = () => spark.sql("SELECT * FROM T ORDER BY a")
+
+            try {
+              // snapshot-1
+              inputData.addData((1, "a"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Nil)
+
+              // snapshot-2
+              inputData.addData((2, "b"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Row(2, "b") :: Nil)
+
+              // snapshot-3
+              inputData.addData((2, "b2"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Row(2, "b2") :: Nil)
+              checkAnswer(
+                spark.sql(
+                  "CALL paimon.sys.create_tag(table => 'test.T', tag => 'test_tag', snapshot => 2)"),
+                Row(true) :: Nil)
+              checkAnswer(
+                spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
+                Row("test_tag") :: Nil)
+              // test rename_tag
+              checkAnswer(
+                spark.sql(
+                  "CALL paimon.sys.rename_tag(table => 'test.T', tag => 'test_tag', target_tag => 'test_tag_1')"),
+                Row(true) :: Nil)
+              checkAnswer(
+                spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
+                Row("test_tag_1") :: Nil)
+              checkAnswer(
+                spark.sql("CALL paimon.sys.delete_tag(table => 'test.T', tag => 'test_tag_1')"),
+                Row(true) :: Nil)
+              checkAnswer(spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"), Nil)
+              checkAnswer(
+                spark.sql(
+                  "CALL paimon.sys.create_tag(table => 'test.T', tag => 'test_latestSnapshot_tag')"),
+                Row(true) :: Nil)
+              checkAnswer(
+                spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
+                Row("test_latestSnapshot_tag") :: Nil)
+              checkAnswer(
+                spark.sql(
+                  "CALL paimon.sys.delete_tag(table => 'test.T', tag => 'test_latestSnapshot_tag')"),
+                Row(true) :: Nil)
+              checkAnswer(spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"), Nil)
+
+              // snapshot-4
+              inputData.addData((2, "c1"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Row(2, "c1") :: Nil)
+
+              checkAnswer(
+                spark.sql("CALL paimon.sys.create_tag(table => 'test.T', tag => 's4')"),
+                Row(true) :: Nil)
+
+              // snapshot-5
+              inputData.addData((3, "c2"))
+              stream.processAllAvailable()
+              checkAnswer(query(), Row(1, "a") :: Row(2, "c1") :: Row(3, "c2") :: Nil)
+
+              checkAnswer(
+                spark.sql("CALL paimon.sys.create_tag(table => 'test.T', tag => 's5')"),
+                Row(true) :: Nil)
+
+              checkAnswer(
+                spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
+                Row("s4") :: Row("s5") :: Nil)
+
+              checkAnswer(
+                spark.sql("CALL paimon.sys.delete_tag(table => 'test.T', tag => 's4,s5')"),
+                Row(true) :: Nil)
+
+              checkAnswer(spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"), Nil)
+            } finally {
+              stream.stop()
             }
-            .start()
-
-          val query = () => spark.sql("SELECT * FROM T ORDER BY a")
-
-          try {
-            // snapshot-1
-            inputData.addData((1, "a"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Nil)
-
-            // snapshot-2
-            inputData.addData((2, "b"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Row(2, "b") :: Nil)
-
-            // snapshot-3
-            inputData.addData((2, "b2"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Row(2, "b2") :: Nil)
-            checkAnswer(
-              spark.sql(
-                "CALL paimon.sys.create_tag(table => 'test.T', tag => 'test_tag', snapshot => 2)"),
-              Row(true) :: Nil)
-            checkAnswer(
-              spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
-              Row("test_tag") :: Nil)
-            // test rename_tag
-            checkAnswer(
-              spark.sql(
-                "CALL paimon.sys.rename_tag(table => 'test.T', tag => 'test_tag', target_tag => 'test_tag_1')"),
-              Row(true) :: Nil)
-            checkAnswer(
-              spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
-              Row("test_tag_1") :: Nil)
-            checkAnswer(
-              spark.sql("CALL paimon.sys.delete_tag(table => 'test.T', tag => 'test_tag_1')"),
-              Row(true) :: Nil)
-            checkAnswer(spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"), Nil)
-            checkAnswer(
-              spark.sql(
-                "CALL paimon.sys.create_tag(table => 'test.T', tag => 'test_latestSnapshot_tag')"),
-              Row(true) :: Nil)
-            checkAnswer(
-              spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
-              Row("test_latestSnapshot_tag") :: Nil)
-            checkAnswer(
-              spark.sql(
-                "CALL paimon.sys.delete_tag(table => 'test.T', tag => 'test_latestSnapshot_tag')"),
-              Row(true) :: Nil)
-            checkAnswer(spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"), Nil)
-
-            // snapshot-4
-            inputData.addData((2, "c1"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Row(2, "c1") :: Nil)
-
-            checkAnswer(
-              spark.sql("CALL paimon.sys.create_tag(table => 'test.T', tag => 's4')"),
-              Row(true) :: Nil)
-
-            // snapshot-5
-            inputData.addData((3, "c2"))
-            stream.processAllAvailable()
-            checkAnswer(query(), Row(1, "a") :: Row(2, "c1") :: Row(3, "c2") :: Nil)
-
-            checkAnswer(
-              spark.sql("CALL paimon.sys.create_tag(table => 'test.T', tag => 's5')"),
-              Row(true) :: Nil)
-
-            checkAnswer(
-              spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"),
-              Row("s4") :: Row("s5") :: Nil)
-
-            checkAnswer(
-              spark.sql("CALL paimon.sys.delete_tag(table => 'test.T', tag => 's4,s5')"),
-              Row(true) :: Nil)
-
-            checkAnswer(spark.sql("SELECT tag_name FROM paimon.test.`T$tags`"), Nil)
-          } finally {
-            stream.stop()
-          }
+        }
       }
     }
   }