четверг, 26 октября 2006 г.

Опять про Мастерхост, электричество и открытость

.masterhost сегодня опять лег из-за электричества. Клиенты глумятся: «не помогли и задранные почти в 2 раза цены, увы». У меня (лично) тоже пара серверов до сих пор в отключке. Письмо написали (не я), звонить пытались. По факту — не работает. Конечно, один сервер запустился, но у него СТОЛЬКО мелких файлов, что проверяться они после аварийного завершения будут ооооой сколько...

При этом, абсолютно непонятно что было-то. Что было? Никто не знает. О том, что было, на вебе не написано (скриншот с временем сделал). Для того, чтобы что-то узнать, нужно написать в support или позвонить туда же, чтобы повисеть сколько-то на трубке, послушать музыку.

А вот можно, чтобы просто было написано о том, что случилось то-то (только честно), что исправится это тогда-то? В почту и на веб — да. Причём, чтобы когда всё ломается, эта функциональность не ломалась. Я не хочу звонить и не хочу писать. Это провайдер, если хочет чтобы к нему относились хорошо или хотя бы адекватно, должен сам звонить и писать.

Это к вопросу об открытости.


Автор: Пётр Диденко.

Комментарии:

А покажи мне хоть одного "открытого" хостера :)
Хотя, конечно, это не отменяет тобою сказанного.
Phil Kulin | October 26, 2006 at 11:58 AM

Фил, Зенон - очень открытый. Правда, это им досталось со старых времен и сейчас бы они никогда не решились, к сожалению, но все же.
Peter Didenko | October 26, 2006 at 12:08 PM

[я не спорю] Хорошо. +1
Всё?
P.S. Опять же, это не отменяет тобою сказанного.
P.P.S. Сокорее дополняет. Сейчас мы во всём болоте пополощемся :)
Phil Kulin | October 26, 2006 at 12:45 PM

Фил, ты чего-то совсем брутальный. Я понимаю твои мотивы, но не разделяю методы :-) Я вот уверен, что через полгода такими системными криками будет за"№ан один, а может два крупных провайдера, а затем и все остальные всё сделают. Как милелькие.
Peter Didenko | October 26, 2006 at 02:02 PM

"Данное событие незапланировано" © :-)
Lazyboa | October 26, 2006 at 03:46 PM

Lazyboa, какое событие, когда началось, что случилось, когда предположительно закончится, если ли workaround'ы? Они хотят об этом обязательно по телефону или по почте "ручками" рассказать. Не предавать огласке факт безобразия, скрыть его, а рассказать только тем, кто заметит "потихоньку", если спросят. Иллюстрирует отношение к тем, кто платит деньги.
Peter Didenko | October 26, 2006 at 03:51 PM

[ворчливо] Брутальный, не брутальный... Таков я, что уж тут поделаешь ;)
Phil Kulin | October 26, 2006 at 04:57 PM

Это цитата из troubles@aha.ru.
Там да, всё подробно расписано, что происходит, когда предположительно пофиксят.
Но клиенту от этого не легче. Клиент сидит и ждёт, а кому нужен ~100% аптайм, тот строит распределённый хостинг.
lazyboa | October 26, 2006 at 08:23 PM

Вообще-то тут начинают возникать вопросы уже не к политике открытости, а к непосредственному бизнесу. В извещении о проблеме компания призналась, что мощности УПСов не хватило для поддержания серверов. Вопрос - это как? Получается, что ни один из моих серверов не имеет резервного питания и дефакто зависит от любого перепада напряжения?
Кроме того, один из серверов так и не поднялся. Но у нас ушло 7 часов, чтобы понять, что он сваливается в kernel panic, 4 часа - чтобы дождаться KVM и вот до сих пор админ пересобирает систему, поскольку из-за некорректного выключения слетели системные файлы. А что они дальше себе думают - как это будет выглядеть при большем количиестве серверов?
Gray | October 27, 2006 at 02:12 AM

Не смог, уважаемый Сергей, после радикально конструктивной полемики пройти мимо :) Вы уж меня простите, но силы воли сдержаться не хватило :)
7 (акцент на цифре СЕМЬ) часов простоя - это факт из Вашей личной биографии (ни в коем случае это не оправдывает самого провайдера).
Сижу почти четыре года за 800км от своей епархии и KVM мне реально понадобился два-три раза. Проблема почти любая решается или прекрасно без него, или всё равно надо "глаза с руками" туда гнать. Чего Вы 4 часа ждали мне, например, не ясно. За это время, с Вашими-то связями, могли туда орду админов нагнать. Да, и rsr232 уже отменили и у Вас в датацентре не оказалось ни одного знакомого, к кому скоммутироваться (вариант сложный, но возможный) даже если у .m нет консольных портов?
Что у Вас слетело? Системные файлы? И что, пересобирать пришлось? :) Это Вы в расчёте на то, что кипа только горе-маркетологи читают? Или Вы что-то не договорили? А зачем вообще пошли в такие детали вдаваться? Как аргумент способный поразить сознание не прокатило, даже если там что-то воде описанного Вами и было. Вернее, сознание поражено, но немного в другом месте. Это что же Вы такое с системным разделом делали? Неужто Вы в каталоге с ядром/объектами ядра ведёте бурные чтение/запись? Медаль Вашему админу :) Кстати, а "системный" бэкап - это ещё не дошедшая до нас мода? Он, собственно, и призван для наискорейшего восстановления системной части.
Если это у Вас будет выглядеть так при большем количестве серверов, придётся, видимо, что-то в консерватори поправить :)
Вобщем, час простоя и час ненормированной аварийной работы системного администратора предъявим .m, а 6 часов уж запишите на себя :)
Phil Kulin | October 28, 2006 at 03:10 AM

Фил, а что вы так разволновались? Да, я кое-что не договорил. Например, что первый тикет на перезагрузку сервера провисел 40 минут, после чего пошли сообщения о глобальных проблемах на площадке и мы отозвали тикет, считая, что, возможно, проблема не в сервере.
Второй тикет на перезагрузку провисел час и только после моего звонка до него дошел админ и посмотрел глазами, в чем дело.
>За это время, с Вашими-то связями, могли туда орду админов нагнать. Да, и rsr232 уже отменили и у Вас в датацентре не оказалось ни одного знакомого, к кому скоммутироваться (вариант сложный, но озможный) даже если у .m нет консольных портов?
Фил, вы что-то не то говорите. Да, у меня есть "связи" с кучей народу, в т.ч. и Мастерхосте и я один раз попросил помочь с получением в аренду сервера, когда на них очередь стояла. Но неужели вы думаете, что я полезу мешать людям, занятым работой, чтобы меня подняли первым? У меня в "связях" начальник аэропорта "Борисполь" значится, так что же - мне требовать ускоренной выгрузки багажа именно с моего рейса теперь?
А что слетело - система слетела. Понадобилось ставить ее заново практически. С перекомпиляцией и т.д. Меня вполне устраивает объяснение админа по этому поводу, его квалификация более чем достаточна для меня.
Gray | October 29, 2006 at 11:22 AM

1. О! Ну вот почти два часа висения тикетов это не четыре часа повозки KVM :) Это две разные вещи. Как массаж ступней :) Да, и вот именно это факт - предъява провайдеру. Я за чистоту претензий. А то начинают гундеть не поделу, а оказывается всё не так. Я Вам, кстати, тогда отвечать не стал именно поэтому. Разговор был ни о чём. Клиент мог налепить любой ерунды.
2. Не знаю, нужны ли Вам мои советы, но я в принципе рекомендую подгонять своего человека, если за адекватное время не удалось понять что проискходит. Просто на разовую работу кого-нибудь взять. Может ничего сильно умного он не сделает, зато не будет гадания на кофейной гуще. Естественно я не имел ввиду неуставных отношений :)
3. Сергей. Я за пять лет видел всё что угодно - rf -rm /, сдохший насмерть винт, сдохший бэкапный винт, что обнаружилось во время восстановления и т.д. Но ни разу. НИ-РА-ЗУ, я не видел слетевшую систему на живом винте. Это теоретически невозможно, если не предпринять специальных действий :) Вас может устраивать любая квалификация, любая цена и любое одновременное выполнение задач (об этом мы в прошлый раз говорили?). Это в принципе нормально. Как пример - дизайн моей домашней странички, меня вполне устраивают ошибки там и её вид, и я совершенно не обижусь если Тёма Лебедев скажет "Ваш сайт - говно" :). В итоге, 3 часа предъявляем .m, а 4 всё таки запишите на себя. Судя по Вашему ответу, Вас это устраивает. Это не зазорно, и не надо валить ВСЕ шишки на провайдера.
4. Давайте дружить :)
Phil Kulin | October 29, 2006 at 01:47 PM

1. Фил, два часа висения тикетов - это один факт для обсуждения с провайдером.
А то, что включение KVM было заказано в переписке в 14:50, потом повторено тикетом в 15:50 и только в 19:00 фактически случилось - это другой факт. Я понимаю при этом, что не одни мы были желающими в тот день.
2. Подгонять следовало сотрудников Мастерхоста - это они в итоге на второй тикет ответили сообщением, что система не грузится. Вот только колцентр в данном случае выступает живым щитом и разговаривать с админами совершенно не получается.
3. Фил, я не готов это обсуждать. Совершенно не готов. Возможно, причина в том, что винты SATA и в сочетании с некорректным выключением что-то побилось.
4. Давайте.
Gray | October 30, 2006 at 12:07 AM




Другие посты по этой теме:



0 коммент.:

Отправить комментарий

Ваш комментарий появится в блоге после проверки администратором