« Определитель партнерок | Настройка вордпресса 2.5 »
Просматривая последние записи в блогах через рейтинг Добробот, по наводке блоггера Папы Карло, посмотрел доклад якобы об архитектуре ПС Яндекс.
Пример как надо делать доклад, если не хочешь, чтобы кто-нибудь что-нибудь понял.
Отчетливо запомнилось, только что докладчик любит пить коньяк. О самой архитектуре сложилось впечатлении что это разношестный зоопарк на нескольких площадках с разным железом, которое чуть ли ни вручную админят каждую машину. Тогда понятно, зачем Яндексу столько сотрудников, наверное половина – сисадмины.
Забавно, как докладывающий чел сначала сыпет какими-то аббревиатурами, причём просклоняв их по своему, а потом жалуется что не может решить проблему с чтением с диска быстрее 150 раз в секунду.
Товарисч, палю тему: внутри алюминиевой коробочки винчестера действительно есть неиллюзорный физический диск, который крутится, а над этим диском на палочке перемешается головка, которая больше 150-200 раз физически не успевает прочитать данные из разных мест. То есть если файл не сидит в каком-то кеше, быстрее не будет, можно не мучиться. Можно мелкие файлы слепить в один большой.
17 Responses
April 21st, 2008 at 15:14:33
// php gravatar() ?>1Alexf, благодарю за упоминание моего блога. Вообще эта конференция была аж в сентябре 2007, странно, что о ней никто не написал (я по крайней мере, не знал о ней, хотя читаю много лент).
Видно, что докладчик типичный сисадмин, да и доклад больше для сисадминов – уж больно терминологии много. Ясное дело, что рассказывать все в деталях никто не будет, все ж это биз
April 21st, 2008 at 15:57:32
// php gravatar() ?>2Да, мне тоже сразу бросилось в глаза что это сисадмин, маскирующийся под программиста, но уши то торчат.
April 21st, 2008 at 16:33:15
// php gravatar() ?>3Яндекосы вообще шифруются, попробуй у них что-нибудь выпытай. Посомтрев ролики так же шифроваться сразу не научишься, тут нужен опыт)))
April 21st, 2008 at 18:15:55
// php gravatar() ?>4>>Товарисч, палю тему
Ты не прав. Если файл раскидан по 10 машинам избыточно, то в идеале скорость будет в 10 раз больше, чем ежели он – бы считался с одной. Затем по сети в 1 Гигабит он достаточно быстро склеивается. В реальности конечно – же это не так, но говорить про то что 150 – 200 операций в секунду это предел…. я – бы так не стал.
April 21st, 2008 at 21:28:36
// php gravatar() ?>5Сео в Пензе, то что ты описал называется RAID, никто это в виде отдельных машин не делает.
April 22nd, 2008 at 22:57:34
// php gravatar() ?>6гм. вообще-то делают
бедняга докладчег – как его пидарасило-то перед зрителями. Хз, я бы с таким уровнем публичных выступлений не выпустил бы оф. представителя ни на какую конференцию. Теперь мы видим, кто там расколбасы в индексе устраивает, и с какими гримасами, “чо”канием и аццкой жестикуляцией админов вылетают морды наших замечательных сайтоф
)
April 23rd, 2008 at 20:22:44
// php gravatar() ?>7Угу. Рейд это пачка винтов на одном компе. Нету смысла (кроме скорости) дублировать данные на 1 машине, это слишком дорого. И если машина встаёт – данные теряются. Есть смысл как раз разносить данные по компарям, тогда скорость увеличивается за счёт синхронного чтения и устойчивость системы в целом за счёт избыточного хранения файлов на разных машинах.
April 23rd, 2008 at 21:19:53
// php gravatar() ?>8Сео в Пензе, речь и шла про скорость. Разносить простое чтение файлов на разные машины – вот что нет смысла делать и так никто не делает, потому что это слишком дорого. Рейд контроллер полюбому стоит дешевле чем сервер.
April 23rd, 2008 at 22:52:18
// php gravatar() ?>9вот ты странный человек. тебе дело говорят – делают так!
April 23rd, 2008 at 23:31:41
// php gravatar() ?>1099th, приведи конкретный пример.
April 24th, 2008 at 00:12:29
// php gravatar() ?>11конкретный пример технологии или внедрения?
вот у нас стоят такие у партнеров – стоит несколько юнитовых накопителей сервачных в стрипе с дубляжом (не помню какой рейд) – данные читаются параллельно с нескольких юнитов.
April 24th, 2008 at 01:00:40
// php gravatar() ?>12Из того что ты написал, я примера не увидел. У меня тоже стоит огого как.
Я написал, что нет смысла использовать параллельные сервера там где нужен обычный рейд, то есть для ускорения чтения обычных файлов, чтобы побороть Average Seek Time. А ты написал что “так делают”. Я не спорю с тем что кто-то может делать глупости, меня интересует пример, где бы у подобной схемы было рациональное объяснение.
Возможный пример с отдачей видеоданных не катит, поскольку 150 больших видеофайлов по размеру в 1 секунду не помещаются, то есть там причины распараллеливания другие.
April 24th, 2008 at 02:27:27
// php gravatar() ?>13Реальный пример – google.com
Но раскидывание файла по машинам делается не только и не столько для увеличения скорости. Оно делается в первую очередь для увеличения надёжности. А вкупе с надёжностью получаешь увеличение скорости.
А насчёт ускорения чтения на машине с параллельным рейд массивом – угу, реально ускоряется, но поисковикам дорого будет параллельный рейд использовать вместе с раскидкой по машинам. А так как вторая мера эффективней по надёжности чем первая, то скорее всего от первой откажутся.
Я так думаю!
April 24th, 2008 at 02:30:33
// php gravatar() ?>14Да, раскидка по машинам ещё и необходима. А вот рейд массив – не обязателен.
April 24th, 2008 at 02:38:31
// php gravatar() ?>15Всё, я понял, Сео в Пензе подпись спамит.
Причём тут вообще надёжноть? Я написал “диск работать быстрее своей физической спецификации не будет”, мне ответили “ты не прав, можно устроить межмашинный рейд и будет быстре”. На что я написал что никто таких рейдов не делает, чтобы решить указанную проблему, поскольку это эдиотизм.
May 3rd, 2008 at 12:15:29
// php gravatar() ?>16ага, а еще доклад Толи Орлова попробуй послушай, тоже фик че поймешь, да еще и с дикцией у него не все хорошо
May 3rd, 2008 at 15:06:38
// php gravatar() ?>17[...] Тут рассказывают больше интересного, чем в докладе про коньяк, доклад больше с уклонов в программизм, поэтому [...]
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf