Spark3.5: Resolve IDENTIFIER FIELDS with merge-on-read bug #11757

601madman · 2024-12-12T01:37:04Z

Problem

When IDENTIFIER FIELDS are set, and merge-on-read mode is used, a validation error occurs due to incorrect metadata schema checks.

Solution

Adjusted the calculateMetadataSchema() method in SparkScanBuilder to avoid validating identifier fields in metadata columns.

Tests

Added unit tests in TestMergeOnReadWithIdentifierFieldsDelete、TestMergeOnReadWithIdentifierFieldsMerge and TestMergeOnReadWithIdentifierFieldsUpdate to validate the fix.

Closes #11709

Fix: Resolve IDENTIFIER FIELDS with merge-on-read bug

de473fb

github-actions bot added the spark label Dec 12, 2024

601madman changed the title ~~Fix: Resolve IDENTIFIER FIELDS with merge-on-read bug~~ Spark3.5: Resolve IDENTIFIER FIELDS with merge-on-read bug Dec 13, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Spark3.5: Resolve IDENTIFIER FIELDS with merge-on-read bug #11757

Spark3.5: Resolve IDENTIFIER FIELDS with merge-on-read bug #11757

601madman commented Dec 12, 2024

Spark3.5: Resolve IDENTIFIER FIELDS with merge-on-read bug #11757

Are you sure you want to change the base?

Spark3.5: Resolve IDENTIFIER FIELDS with merge-on-read bug #11757

Conversation

601madman commented Dec 12, 2024

Problem

Solution

Tests