Update main.rst #2

dalt74 · 2018-04-05T06:03:58Z

Changes by @Outlingo

socketpair · 2018-05-02T11:22:43Z

main.rst

 #. Перед извлечением диска физически на лету выполнить:
   ``echo 1 > /sys/block/{data-disk}/device/delete``.
+   Но это не обязательно. Вменяемое железо через несколько секунд поймёт,


Не вот нет. Эта команда профлушивает буферы перед изыманием. И если этого не сделать, то иногда остается /dev/sdX но с ним ничего сделать нельзя, всегда ио еррор. Любое железо понимает это мгновенно, но линукс иногда охреневает с этого. И да, не везде на самом деле есть сата хотплуг.

socketpair · 2018-05-02T11:23:19Z

main.rst

@@ -24,8 +26,12 @@
 #. ``partprobe /dev/{journal-disk}``. fdisk не умеет говорить ядру о применении
   измененной таблицы разделов если диск используется (например, под другие
   журналы/бд на этом же диске.
+#. Но лучше использовать gdisk. Тогда в принципе не получится поменять


ты наверно с партед перепутал ?

socketpair · 2018-05-02T11:23:54Z

main.rst

@@ -24,8 +26,12 @@
 #. ``partprobe /dev/{journal-disk}``. fdisk не умеет говорить ядру о применении


туду: написать что эта тулза из комплекта партед

socketpair · 2018-05-02T11:27:20Z

main.rst

+  "start from root via host" правилами. 
+* При потере журнала вседиски на него зааттаченные превращаются в труху. На самом деле это не совсем
+  так, и можно пересоздать журнал, но при этом все копии PG на этой OSD будут оставшими, и предстоит
+  рекавер и обязательный scrub/deep scrub.


Но жто ж по времени и смыслу тоже самое что перебекфилл этого осд. не так ли? так зачем нужен осд у которого все обжекты устарели ? ну только для кейса когда запись и чтение отличаются по времени или когда это единственная сохранившаяся копия.

socketpair · 2018-05-02T11:28:09Z

main.rst

+  названием "вероятность отказа диска" и "время восстановления избыточности". Поскольку данные
+  размазанны более-менее равномерно, это приводит к тому, что при отказе двух дисков случается
+  гарантированная потеря данных, а если у вас более 500 дисков, вероятность отказа второго диска
+  когда первый ещё не отрекаверился заметно больше ноля. Поэтому совсем большие пулы "на весь кластер"


не понял как количество реплик связано с масштабом размазывания.

socketpair · 2018-05-02T11:30:20Z

main.rst

 * Отключить оффлоадинг (и как проверить помогло ли) - меряем RTT внутри TCP.
 * джамбофреймы могут помочь но не особо. сложности со свичами обычно.
-* мониторить состояние линка. оно иногда самопроизвольно падает с гигабита на 100 мегабит.
+* мониторить состояние линка. оно иногда самопроизвольно падает с гигабита на 100 мегабит. Но это проблема


поэтому и нужно мониторить. и да, линк пропадает по причине говнопроводов например. Выпиливай.

Update main.rst

c54102b

socketpair force-pushed the master branch 3 times, most recently from e3529cd to 6e2659a Compare May 2, 2018 11:06

socketpair reviewed May 2, 2018

View reviewed changes

socketpair force-pushed the master branch from 10f118e to ace8bef Compare May 4, 2018 02:57

socketpair force-pushed the master branch from 82e24a4 to 9f50789 Compare May 17, 2018 13:20

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Update main.rst #2

Update main.rst #2

dalt74 commented Apr 5, 2018

socketpair May 2, 2018

socketpair May 2, 2018

socketpair May 2, 2018

socketpair May 2, 2018

socketpair May 2, 2018

socketpair May 2, 2018

		@@ -24,8 +26,12 @@
		#. ``partprobe /dev/{journal-disk}``. fdisk не умеет говорить ядру о применении

Update main.rst #2

Are you sure you want to change the base?

Update main.rst #2

Conversation

dalt74 commented Apr 5, 2018

socketpair May 2, 2018

Choose a reason for hiding this comment

socketpair May 2, 2018

Choose a reason for hiding this comment

socketpair May 2, 2018

Choose a reason for hiding this comment

socketpair May 2, 2018

Choose a reason for hiding this comment

socketpair May 2, 2018

Choose a reason for hiding this comment

socketpair May 2, 2018

Choose a reason for hiding this comment