-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Расставить ударения в словах на -ец #15
Comments
абази́нец — от абазины |
Слова, где ударение уже проставляется автоматически, можно пропустить — они уже есть в словаре. Разве что проставляется неправильно, тогда дайте ваш вариант. |
@Pogrebnoj-Alexandroff Замечательно, большое спасибо! Я расставил ударения автоматически в исходном списке, чтобы не делать больше работы, чем нужно. Если сделаете остальное в том же духе, буду премного благодарен. |
малева́нец — от малёванцы? Может, тогда малёванец? @Pogrebnoj-Alexandroff |
малева́нец и малёванцы -- одно и то же со ссылкой одного на другое, как в словарях пишут см., но в данном случае ударения разные: в зависимости от букв Е или Ё. Остальное сделаю позже. |
Я нашел только малёванцы, соответственно в единственном числе малёванец. Варианта малева́нец не нашел. Можете подсказать, где вы его встретили? |
ВП пишут все, кто во что горазд, и — зачастую ещё не совсем грамотные дети. Малеванцы, малеванец, от малевать. https://dic.academic.ru/dic.nsf/dic_synonims/74174/%D0%BC%D0%B0%D0%BB%D0%B5%D0%B2%D0%B0%D0%BD%D0%B5%D1%86 малеванец малеванец малеванец |
От того, что кто-то из современников утверждает: — получило своё название по имени основателя и главы Кондратия Алексеевича Малёванного, — не означает, что через ё и писалось или должно писаться слово. Да и малеванцами могут быть не только сектанты, а и пацаны — малюющие заборы. Другие книги 1920-2020 годов: |
@Pogrebnoj-Alexandroff Из приведенных вами источников ударение явно указано только у Лопатина (малева́нцы), из остальных же написаний через Е ударение однозначно не выводится. Но Лопатина уже вполне достаточно, спасибо! Таким образом, можно зафиксировать два варианта: малёванец и малева́нец. Остальные падежно-числовые формы программа построит автоматически. |
Согласен, при желании малеванцем можно назвать и пацана, и его рисунок на заборе, и сам забор. Это будут так называемые окказиональные употребления - когда значение слова ясно из контекста, но устойчиво за этим словом не закреплено. Такие значения слишком вариативны и неустойчивы и поэтому обычно не фиксируются в словарях. |
ма́меринец — неодуш. обшивка вкруг чего-либо смоленою парусиной для предотвращения попадания воды; впервые ма́меринги мн., Уст. морск. 1720 г.; см. Смирнов 186. Из голл. mamiering "всякая нашивка кожаная или из крашеной парусины", мн. mamierings; см. Мёлен 131; Маценауэр 250. |
я́сенец — от ясень |
Вообще-то точнее было бы записать всё так (м.р. / ж.р. — мн.ч. от чего): |
Поддерживаю и предлагаю представить данные в табличном виде и завести под это дело репозиторий: https://github.com/morpher-ru/demonyms/blob/master/demonyms.tsv |
Так можно легко видеть, кто что изменил, и обсуждать правки. |
Неудобно заполнять, так как текст сливается и нет самой таблицы для редактирования или каких-либо разграничений и меток для нового столбца. Строки пронумерованы, а со столбцами просто беда.
|
Хотел показать код, а сгенерировалась таблица. |
Ничего, я понял. Хорошо, можете делать, как вам удобнее. Я использовал VS Code с расширением |
Как вариант - использовать редактор Гитхаба, новые строки добавлять копированием существующих. В общем, присылайте, как вам удобнее, я добавлю в репозиторий. |
Почему нельзя сделать таблицу для заполнения в реальном времени и без всяких кодировок? https://www.tablesgenerator.com/ |
В demonyms.tsv для разделения колонок используется символ табуляции, в *. csv - запятая, в *.md - |. Делайте, как вам удобнее. |
Ясно. Есть. Добавил кое-что. |
Замечательно, спасибо! А что насчет слов из списка вверху этой страницы, с которых собственно и начался разговор? |
Надо будет дополнять. Кроме него, ещё остальных горожан и сельчан со временем добавим. |
Насчет колонки "тип". Я вижу, что вы немного изменили ее толкование. У вас она превратилась в пространное описание значения слова из колонки "множественное число":
Проблема в том, что эта информация никак не формализована и слабо поддается автоматическому анализу. Как я писал в README, в колонке "тип" предполагалось указывать тип понятия, обозначаемого словом в колонке "от": город, район, штат, страна, партия, фамилия. Список этот должен получиться не очень широкий, что открывает возможности для автоматического анализа. Например, открыв наш файл в Excel, мы можем легко отфильтровать его по условию "тип" = "фамилия" и получить список демонимов, образованных от фамилий. Или от партий. Указанная вами в колонке "тип" информация тоже полезна, но думаю, что место ей в какой-нибудь другой колонке, например, "примечание" или "значение демонима". |
|
В «от» — от чего образовано или чему соответствует, а посему и написано одним словом в основном. |
@bzaar Добавил файл с -ец. https://github.com/Pogrebnoj-Alexandroff/demonyms/blob/patch-1/-jets.tsv
Для слов не имеющих окончаний или изменений для того или иного рода и числа, в ячейке таблицы ничего не указано. |
При подсчёте, получается около 2,163 слова. |
Отлично. Да, лучше дефисом обозначить нулевое окончание, в отличие от отстутствующих форм. Еще бы добавить колонки "от" и "прилагательное": англи -я, -йский, -чанин, -чанка, -чане Поправьте эфиопЕЦ. |
Для отсутствующих форм, наверное, надо поставить прочерк (или оставить пустую клетку?), так как в отдельных случаях основа может выступать формой сло́ва в единственном числе мужского ро́да и тогда может быть зде́сь возможно использовать знак переноса, как в окончаниях -ец, -ка, -цы... что и будет указывать на связь ячейки с основой. |
@bzaar Не вижу в чём проблема с эфио́пами? |
Быстро не получится и это будет то, что уже есть и было в другом файле — про «от». |
Основа для прописных будет не соответствовать именам собственным с заглавной буквы, как англичанин (тут, как раз, нет -ец — что предусмотрено для данного файла) и Англия (есть в файле домонимов). Для «англичанин» и прочих (в данном случае) неизменная основа будет без -ин, или... для англичан — англичанин, англичанка, англичане. А потом куда англов деть? Тогда основой будет не англи, а англ — а́нглы, англоса́ксы, А́нглия, англи́йский, англика́нский, англика́не, англича́не и т.д. Везде ударения не совпадают с корневой основой. Я думал о том, чтобы взять корень (самый краткий) и к нему привязать все заготовленные ранее приставки, приложения, суффиксы, окончания и т.д. поячеечно-последовательным образом (как паутина или клубок), и — тогда автоматом сгенерируются все возможные и невозможные (предполагаемые) варианты изменений или новые словоформы. Тут появятся и те самые «оказийные» слова, которые не надо будет пояснять, так как будет единая пояснённая основа. |
|
Назначение колонок:
|
@bzaar Последнее время, как года два уже, Гугл перестал показывать многие русские словоформы, так как глупо и по-простецки стал ориентироваться лишь на вики-проекты. Соответственно, опасно ориентироваться теперь на иноземные источники информации поисковиков. Кроме того, в интернете до сих пор не опубликованы сканы трудов из АН СССР и России, и — соответственно, — нет всего многообразия и разнообразия в нюансах русской словесности. |
Например? |
@bzaar Какой-то глюк. Пытался очистить браузер и перезагрузить таблицу, но ничего не получается: всё равно висят дубликаты слов. |
Вы их внесли в этом коммите. |
Я удалил дубликаты в этом пул-реквесте. Нажмите Merge и они у вас пропадут. |
Странно. Я не вносил дубликаты: у меня в оригинале такого нет. |
@bzaar Общее количество слов всегда совпадает, но тут почему-то — при публикации или дополнении, — появляются дубликаты. |
Мне сложно сказать что-либо определенное по поводу дубликатов. Какой программой вы пользуетесь для редактирования? Для заливки файла на Гитхаб? |
Вы принципиально игнорируете мои пул-реквесты? На мой взгляд, гораздо удобнее обсуждать узкие темы типа индонезийского острова Бабар в одном месте, а не вперемешку с дубликатами. |
@bzaar LibreOffice calc + обычная копипаста для переноса сюда. |
А для пулов удобнее сначала всё загрузить и лишь потом обсуждать и править, так как постоянно перегружать туда-сюда готовую таблицу с материалом не очень удобно и даже муторно. |
Тогда проверьте перед нажатием Commit, что скопипастилось правильно. Для синхронизации локальной копии с Гитхабом обычно используют программу git. Такие редакторы как VS Code делают синхронизацию за один клик, исключая ошибки, подобные вашим дубликатам:
Как раз эту проблему и решает программа git (вкупе с VS Code): изменения синхронизируются в обоих направлениях за один клик. А момент «когда все будет загружено», боюсь, наступит нескоро: всегда найдется что еще добавить. |
@bzaar Оказывается, дубликаты, это глюк в Open/LibreOffice Calc. При добавление строк нумерация не нарушается и увеличивается (как, конечно же, должно быть), но при удалении строк нумерация нарушается (исчезая с удалением строки, а не производя автоматический пересчёт) и при копипастировании (копировании с переносом) таблиц, в этих удалённых ранее местах могут образовываться дубликаты. |
Понятно :) Рекомендую Git + VS Code или IntelliJ IDEA. |
@bzaar Кажется всё + 1 файл dom |
@Pogrebnoj-Alexandroff, спасибо за файлы. В ближайшее время посмотрю. |
@bzaar Добавил вариационные формы встречающихся слов в наименованиях горожан. |
Расставить ударения и указать, от какого слова образовано данное слово, например:
пѐрвопоселе́нец — пе́рвое поселе́ние
снабже́нец — снабже́ние
щёлкинец — Щёлкин
эскадро́нец — эскадро́н
ю̀жносахали́нец — Ю́жный Сахали́н
шлёпанец — шлёпать
Слова, где ударение уже проставляется автоматически, можно пропустить — они уже есть в словаре. Разве что проставляется неправильно, тогда дайте ваш вариант.
Также желательно отметить одушевленность. А то иногда непонятно, например, эскадронец — это маленький эскадрон или член эскадрона?
The text was updated successfully, but these errors were encountered: