try to calculate width of UTF-8 encoded characters #12066

NaN-git · 2024-12-15T21:14:17Z

Motivation

Nix assumes that each UTF-8 encoded character has a maximum width of 1, which can corrupt the terminal output, when wider characters are printed.

An additional header-only dependency widechar_width.h is introduced, which is basically a set of large lookup tables. I'm not sure whether the addition of the dependency is acceptable. Personally, I would have copied the lookup tables into the Nix source code.

Context

Fixes Progress bar width calculation does not recognize double-width characters #12014, includes tests

The functionality can be extended to verify UTF-8 encoded strings and to convert them to UCS-4 encoded strings.

Add 👍 to pull requests you find important.

The Nix maintainer team uses a GitHub project board to schedule and track reviews.

src/libutil/package.nix

src/libutil/terminal.cc

NaN-git requested a review from edolstra as a code owner December 15, 2024 21:14

Mic92 reviewed Dec 16, 2024

View reviewed changes

src/libutil/package.nix Outdated Show resolved Hide resolved

Mic92 reviewed Dec 16, 2024

View reviewed changes

src/libutil/package.nix Outdated Show resolved Hide resolved

Mic92 reviewed Dec 16, 2024

View reviewed changes

src/libutil/package.nix Outdated Show resolved Hide resolved

NaN-git force-pushed the utf-8 branch 4 times, most recently from e28764d to d54caed Compare December 17, 2024 23:28

Mic92 reviewed Dec 17, 2024

View reviewed changes

src/libutil/terminal.cc Show resolved Hide resolved

NaN-git force-pushed the utf-8 branch from d54caed to 9182545 Compare December 27, 2024 19:50

Mic92 force-pushed the utf-8 branch 3 times, most recently from 6fa3984 to 14b171d Compare December 28, 2024 10:53

try to calculate character width

92e3095

Mic92 force-pushed the utf-8 branch from 14b171d to 92e3095 Compare December 28, 2024 11:01

Mic92 enabled auto-merge December 28, 2024 11:07

Mic92 merged commit b3eab02 into NixOS:master Dec 28, 2024
12 checks passed

roberth added the backport 2.25-maintenance Automatically creates a PR against the branch label Jan 10, 2025

mergify bot mentioned this pull request Jan 10, 2025

try to calculate width of UTF-8 encoded characters (backport #12066) #12182

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

try to calculate width of UTF-8 encoded characters #12066

try to calculate width of UTF-8 encoded characters #12066

NaN-git commented Dec 15, 2024 •

edited

Loading

try to calculate width of UTF-8 encoded characters #12066

try to calculate width of UTF-8 encoded characters #12066

Conversation

NaN-git commented Dec 15, 2024 • edited Loading

Motivation

Context

NaN-git commented Dec 15, 2024 •

edited

Loading