Современные решения

для защиты Windows приложений

и восстановления исходного кода
Автор: крис каперски ака мыщъх. Дата публикации: 16.04.2006

MBR своими руками


Сегодня мы напишем свой менеджер мультизагрузки. это такая штука, что сидит в загрузочном секторе и грузит любую из нескольких установленных операционных систем по нашему выбору. он познакомит нас с прерыванием INT 13h, таблицей разделом и кое-чем еще

введение
Стандартный загрузчик, устанавливаемый большинством осей по умолчанию, слишком примитивен, чтобы его воспринимать всерьез, а нестандартные загрузчики от независимых разработчиков обычно слишком неповоротливы, монстроузны и ненадежны. Вот и давайте напишем свой! Пока мы будет его писать, мы познаем дао и дзен ассемблера, научимся отлаживать программы без отладчика, и попробуем низкоуровневое железо винчестера на вкус.
начальная теоретическая подготовка
Загрузка системы начинается с того, что BIOS считывает первый сектор жесткого диска, размещает его в памяти по адресу 0000:7С00h и передает сюда управление. Программисты называют его Главным Загрузочным Сектором (Master Boot Record), или сокращенно MBR. В начале MBR расположен машинный код загрузчика, за ним идет Таблица Разделов (Partition Table), описывающая схему разбиения логических дисков. В конце загрузочного сектора находится сигнатура 55h AAh, говорящая BIOS’у о том, что это действительно MBR, а не что-то еще.
Загрузчик должен проанализировать Таблицу Разделов, найти предпочтительный логический диск, считать его первый сектор (он называется загрузочным — boot) и передать ему бразды правления. Вот минимум требований, предъявляемых к стандартному загрузчику, главный недостаток которого заключается в том, что на каждом логическом диске может быть установлена только одна операционная система, причем, она должна быть установлена непременно на Primary Master’е, в противном случае загрузчик ее просто "не увидит" и нам придется менять порядок загрузки в BIOS Setup, а это слишком хлопотно и утомительно. Наш загрузчик будет свободен от всех этих глупых ограничений, но прежде чем зарываться вглубь, окинем MBR беглым взглядом.
Воспользовавшись любым редактором диска (например, Microsoft Disk Probe из комплекта Resource Kit, прилагаемого к лицензионной Windows), считаем первый сектор физического диска. Первые 1BBh байт занимают код и данные загрузчика, среди которых отчетливо выделяются текстовые строки (кстати говоря, русифицировав сообщения загрузчика, Microsoft допустила грубейшую стратегическую ошибку, ведь никакого кириллического фонта в BIOS’е нет и русские символы выглядят бессмысленной абракадаброй).
По смещению 1BBh расположен четырехбайтовый идентификатор диска, принудительно назначаемый Windows при запуске Disk Manager’а. Коварство Microsoft не знает границ! Еще со времен первых IBM PC (тогда они назывались XT), загрузчик владел первыми 1BEh байтами MBR-сектора, и достаточно многие загрузчики (и вирусы!) использовали эти байты на всю катушку. Нетрудно сообразить, что произойдет, если внутрь загрузчика вдруг запишется идентификатор. Это убьет его! Поэтому, байты 1BBh – 1BEh лучше чего не трогать.
Со смещения 1BEh начинается Таблица Разделов, представляющая собой массив из четырех записей типа partition. Каждый partition описывает свой логический диск, что позволяет нам создавать до четырех разделов на каждом HDD. Динамические диски, впервые появившиеся в W2K, хранятся в Базе Менеджера Логических Дисков (Logical Disk Manager Database) и в таблице разделов присутствовать не обязаны.
В общем, устройство Главного Загрузочного Сектора выглядит так:

смещение размер назначение 000h перемен. код загрузчика 1BBh 4h идентификатор диска 1BEh 10h partition 1 1CEh 10h partition 2 1DEh 10h partition 3 1EEh 10h partition 4 1FEh 0x2 признак таблицы разделов сигнатура 55h Aah

Таблица Разделов — это святая святых операционной системы. Каждая запись partition состоит из: адресов начала и конца раздела, типа раздела (NTFS, FAT16, FAT32…), количество секторов в разделе и флага "загружечности" раздела.
Все адреса задаются либо CHS (Cylinder-Head-Sector — Цилиндр-Головка-Сектор), либо LBA (Logical Block Address – Логический Адрес Блока) формате. Конкретный формат определяется типом раздела (Boot ID), записанным в 04h байте. Количество существующих типов огромно и было бы слишком утомительно перечислять их здесь. В таблице 3 приведены лишь самые популярные из них.
В CHS-формате, 01h и 05h байты partition’а хранят номер первой и последней головки раздела (см. таблицу 2). Байты 02h и 06h хранят 5 младших бит начального/конечного сектора и по два старших бита номера цилиндра, а оставшиеся биты лежат в следующем байте. Получается довольно запутанная схема, да к тому же адресующая только первые 8 Гбайт дискового пространства (CHS адрес занимает три байта или 24 бита, что при длите сектора в 512 байт дает 512*224 == 8.388.608 байт). Ха! Да жесткие диски преодолели этот барьер еще в прошлом веке! Это было достигнуто за счет введения LBA-адресации, последовательно нумерующей все сектора от 0 до многодетной матери. Начало раздела хранится в 32-битном поле relative offset (относительное смещение), содержащим смещение первого сектора раздела от начала partition или, попросту говоря, расстояние между концом partition и началом раздела. Конец раздела в явном нигде не хранится, вместо этого в специальном 32-битном поле partition size записывается количество секторов в разделе. Как нетрудно подсчитать, предельно допустимый размер одного раздела составляет (512*232 == 2.199.023.255.552 байт или 2.048 Гбайт), а совокупный объем всего диска вообще не ограничен! Так что, для сегодняшних нужд LBA-адресации вполне достаточно, а там уж мы что-нибудь придумаем.

формат partition:

смещение разм. назначение 000 1BE 1CE 1DE 1EE BYTE флаг активного загрузочного раздела. (Boot Indicator) 80h – загрузочный раздел, 00h – не загрузочный 001 1BF 1CF 1DF 1EF BYTE стартовая головка раздела 002 1C0 1D0 1E0 1F0 BYTE стартовый сектор раздела (биты 0 – 5) старшие биты стартового цилиндра (биты 6-7) 003 1C1 1D1 1E1 1F1 BYTE младшие биты стартового цилиндра (биты 0-7) 004 1C2 1D2 1E2 1F2 BYTE идентификатор системы (Boot ID), см. таблицу.3 005 1C3 1D3 1E3 1F3 BYTE конечная головка раздела 006 1C4 1D4 1E4 1F4 BYTE конечный сектор раздела (биты 0 – 5) старшие биты конечного цилиндра (биты 6-7) 007 1C5 1D5 1E5 1F5 BYTE младшие биты конечного цилиндра (биты 0-7) 008 1C6 1D6 1E6 1F6 DWORD смещение раздела относительно начала таблицы разделов в секторах 00С 1CA 1DA 1EA 1FA DWORD кол-во секторов раздела

Возможные значения Boot ID:

Boot ID тип раздела 00h раздел свободен 0x01 FAT12 (менее чем 32.680 секторов в томе или 16 Мбайт), CHS 0x04 FAT16 (32,680-65,535 секторов или 16-33 Мбайт), CHS 0x05 расширенный раздел (extended partition), CHS 0x06 BIGDOS FAT16 раздел (33 Мбайт – 4 Гбайт), CHS 0x07 NTFS-раздел, CHS 0x0B FAT32 раздел, CHS 0x0C FAT32 раздел с поддержкой расширенной BIOS INT 13h, LBA 0x0E BIGDOS FAT16 раздел с поддержкой расширенной BIOS INT 13h, LBA 0x0F расширенный раздел с поддержкой расширенной BIOS int 13h, LBA 0x42 динамический диск, LBA 0x86 legacy FT FAT16 раздел, CHS 0x87 legacy FT NTFS раздел, CHS 0x8B Legacy FT volume formatted with FAT32, CHS 0x8C Legacy FT volume using BIOS INT 13h extensions formatted with FAT32, LBA

Четыре раздела partition обслуживают до четырех логических дисков, а больше уже никак. На большее в MBR-секторе просто не хватает места! Но ведь хорошо известно, что FDISK может разбивать винчестер хоть на 26 разделов. Как же ему это удается? А вот как! Поимо Основной Таблицы Разделом, хранящейся в MBR мы можем создавать любое количество Расширенных Таблиц Разделов (Extended Partition Table), разбросанных по всему диску. Если partition имеет тип 05h или 0Fh, то она указывает совсем не на начало раздела, а на следующий MBR. Точнее, не совсем MBR, но нечто очень на него похожее. В нем присутствует полноценная Таблица Разделов с четырьмя входами: partition 1, partition 2, partition 3 и partition 4, каждая из которых указывает либо на логический диск, либо на новый MBR. Длина такой цепочки практически неограниченна и может превышать 26. Однако, назначить буквы всем последующим разделам уже не удаться и под Windows 9x они будут просто не видны. Windows NT поддерживает гибридный механизм наименования разделов — по буквам и по именем, поэтому ей эти ограничения не страшны.
Стандартный загрузчик позволяет запускать системы только из Основной Таблицы Разделов. Цепочку MBR’ов он не анализирует. В своем загрузчике мы исправим этот недостаток.

MBR

интерфейс INT 13h
Управлять дисками можно как через порты ввода/вывода, так и через BIOS. Порты намного более могущественны и интересны, однако, BIOS программируется намного проще, к тому же она поддерживает большое количество разнокалиберных накопителей, абстрагируя нас от конструктивных особенностей каждой конкретной модели. Поэтому, мы будем действовать через нее, а точнее через интерфейс прерывания INT 13h.
Попробуем прочитать сектор с диска в CHS-mode. Естественно, действовать нужно из самого MBR или из "голой" MS-DOS, иначе у нас ничего не получится, ведь Windows NT блокирует прямой доступ к диску даже из режима "Эмуляции MS-DOS"!
Номер функции заносится в регистр AH. В случае чтения он равен двум. Регистр AL отвечает за количество обрабатываемых секторов. Поскольку, мы собираемся читать по одному сектору за раз, занесем сюда единицу. Регистр DH хранит номер головки, а DL – номер привода (80h – первый жесткий диск, 81h – второй и так далее). Пять младших битов регистра CL задают номер сектора, оставшиеся биты регистра CL и восемь битов регистра CH определяют номер цилиндра, который мы хотим прочитать. Регистровая пара ES:BX указывает на адрес буфера-приемника. Вот, собственного говоря, и все. После выполнения команды INT 13h считываемые данные окажутся в буфере, а если произойдет ошибка (например, головка споткнется о BAD-сектор) BIOS установит флаг переноса (carry flag) и мы будем вынуждены либо повторить попытку, либо вывести грустное сообщение на экран.
На ассемблерном языке это звучит так:

MOV SI, 1BEh ; на первый partition MOV AX, CS ; настраиваем ES MOV ES, AX ; MOV BX, buf ; смещение буфера … read_all_partitions: MOV AX, 0201h ; читать 1 сектор с диска MOV DL, 80h ; читать с первого диска MOV DH, [SI+1] ; стартовый номер головки MOV CX, [SI+2] ; стартовый сектор с цилиндром INT 13h JC error ; ошибка чтения ; обрабатываем считанный boot-сектор или extended partitions ; ========================================================== ; CMP byte [SI], 80h JZ LOAD_BOOT ; это загрузочный раздел ; передаем на него управление CMP byte [SI+4], 05h JZ LOAD_CHS_EXT ; это Расширенная Таблица Разделов в CHS-формате CMP byte [SI+4], 0Fh JZ LOAD_LBA_EXT ; это Расширенная Таблица Разделов в LBA-формате ADD SI, 10h ; переходим на следующую partition CMP SI, 1EEh JNA read_all_partitions; читаем все партиции одну за другой … buf rb 512 ; буфер на 512 байт

Запись сектора в CHS-режиме происходит практически точно так же, только регистр AH равен не 02h, а 03h. С LBA-режимом разобраться намного сложнее, но мы, как настоящие хакеры, его обязательно осилим. Вот только пива хлебнем.
Чтение сектора осуществляется функцией 42h (AH = 42h). В регистр DL, как и прежде, заносится номер привода, а вот регистровая пара DS:SI указывает на адресный пакет (disk address packet), представляющий собой продвинутую структуру следующего формата:

смещение тип назначение 00h BYTE размер пакета 10h или 18h 01h BYTE зарезервировано и должно быть равно нулю 02h WORD сколько секторов читать 04h DWORD 32-разрядный адрес буфера-приемника в формате seg:offs 08h QWORD стартовый номер сектора для чтения 10h QWORD 64-разряный плоский адрес буфера приемника (используется только если 32-разряный адрес равен FFFF:FFFF)

Код, читающий сектор в LBA-режиме, в общем случае выглядит так:

MOV DI, 1BEh ; на первый partition MOV AX, CS ; настраиваем… MOV buf_seg ; …сегмент MOV EAX, [DI+08h] ; смещение partition относительно начала раздела ADD EAX, EDI ; EDI должен содержать номер сектора текущего MBR MOV [X_SEC] ; … read_all_partitions: MOV AH, 42h ; читать сектор в LBA-режиме MOV DL, 80h ; читать с первого диска MOV SI, dap ; смещение адресного пакета INT 13h JC error ; ошибка чтения … dap: packet_size db 10h ; размер пакета 10h байт reserved db 00h ; заначка для будущих расширений N_SEC dw 01h ; читаем один сектор buf_seg dw 00h ; сюда будет занесен сегмент буфера-приемника buf_off dw buf ; смещение буфера-приемника X_SEC dd 0 ; сюда будет занесен номер сектора для чтения dd 0 ; реально неиспользуемый хвост 64-битного адреса buf rb 512 ; буфер на 512 байт

Запись осуществляется аналогично, только регистр AH содержит не 42h, а 43h. Регистр AL определяет режим: если бит 0 равен 1, BIOS выполняет не запись, а ее эмуляцию. Бит 2, будучи взведенным задействует запись с проверкой. Если AL равен 0, выполняется обыкновенная запись по умолчанию.
Теперь, освоившись с дисковыми прерываниями, перейдем к обсуждению остальных аспектов программирования.

как программируют загрузчики
Лучше всего загрузчики программируются на FASM. С точки зрения ассемблера загрузчик представляет собой обыкновенный двоичный файл, предельно допустимый объем которого составляет 1BBh (443) байт. Немного? Но не будет спешить с выводами. Всякий раздел всегда начинается с начала цилиндра, а это значит, что между концом MBR и началом раздела имеется по меньшей мере sector per track свободных секторов. Практически все современные винчестеры имеют по 64 секторов в треке, что дает нам: 443 + 63*512 == 32.699 байт или ~32 Кбайт. Да в этот объем даже графический интерфейс с мышью и голой красавицей на обоях уместить можно. Но мы не будем! Настоящие хакеры работают в текстовом режиме с командной строкой, а красавиц лучше трахать, чем смотреть.
Как уже говорилось, BIOS загружает MBR по адресу 7C00h, поэтому в начале ассемблерного кода должна стоять директива ORG 7C00h, а еще USE16 — ведь загрузчик выполняется в 16-разряном реальном режиме. Позже, при желании он может перейти в защищенный режим, но это будет уже потом. Не будет лезть в такие дебри.
Обнаружив загрузочный раздел (а обнаружить это можно по флагу 80h, находящемуся по смещению от начала partition), загрузчик должен считать первый сектор этого раздела, разместив его в памяти по адресу 0000:7C000h, то есть аккурат поверх своего тела. А вот это уже нехорошо! И чтобы не вызвать крах системы, загрузчик должен заблаговременно перенести свою тушу в другое место, что обычно осуществляется командой MOVSB. Копироваться можно в любое место памяти — от 0080:0067h до 9FE00h. Память, расположенную ниже 0080:0067h лучше не трогать, т. к. здесь находятся вектора прерываний и системные переменные BIOS’а, а от A000h и выше начинается область отображения ПЗУ, так что предельно доступный адрес равен A000h — 200h (размер сектора) == 9FE00h.
Что еще? Ах да! Трогать DL регистр ни в коем случае нельзя, поскольку в нем передается номер загрузочного привода. Некоторые загрузчики содержат ошибку, всегда загружаясь с первого жесткого диска. Стыдно не знать, что BIOS уже лет десять как позволяют менять порядок загрузки и потому загрузочным может быть любой привод.
Кстати говоря, FASM – единственный известный мне ассемблер, "переваривающий" команду дальнего вызова JMP 0000:7C000h напрямую. Все остальные ассемблеры заставляют извращаться приблизительно так: PUSH offset_of_target/PUSH segment_of_target/RETF. Здесь мы заталкиваем в стек сегмент и смещение целевого адреса и выполняем далекий RETF, переносящий нас на нужное место. Еще можно воспользоваться самомодифицирующимся кодом, собрав команду JMP FAR "вручную" или просто расположить целевой адрес в одном сегменте с исходным адресом (например, 0000:7C000h  0000:7E000h), но это все муторно и утомительно.
В общем, скелет нашего загрузчика будет выглядеть так:

use16 ORG 7С00h CLD ; копируем слева направо (в сторону увеличения адресов) MOV SI,7C00h ; откуда копировать MOV DI,7E00h ; куда копировать MOV CX,200h ; длина сектора REP MOVSB ; копируем ; // выбираем раздел, который мы хотим загрузить, ; // считываем его в память по адресу 0000:7C000h ; // см. листинг 1, 2 JMP 0000:7C000h ; передаем управление на boot-сектор

инсталляция нашего загрузчика в MBR
Под старушкой MS-DOS записать свой загрузчик в MBR было просто — достаточно дернуть прерывание INT 13h, функция 03h (запись сектора). Но под Windows NT этот прием уже не работает и приходится прибегать к услугам функции CreateFile. Если вместо имени открываемого фала указать название устройства, например, "\\.\PHYSICALDRIVE0" (первый физический диск), мы сможем свободно читать и записывать его сектора вызовами ReadFile и WriteFile соответственно. При этом, флаг dwCreationDisposition должен быть установлен в значение OPEN_EXISTING, а dwShareMode — в значение FILE_SHARE_WRITE. Еще потребуют права root’а или в терминологии Windows – администратора, иначе ничего не получится.
Законченный пример вызова CreateFile выглядит так:

XOR EAX,EAX PUSH EAX ; hTemplateFile PUSH dword FILE_ATTRIBUTE_NORMAL ; dwFlagsAndAttributes PUSH dword OPEN_EXISTING ; dwCreationDisposition PUSH EAX ; lpSecurityAttributes PUSH dword FILE_SHARE_WRITE ; dwShareMode PUSH dword (GENERIC_WRITE OR GENERIC_READ) ; dwDesiredAccess PUSH DEVICE_NAME ; имя устройства CALL CreateFile ; открываем устройство INC EAX TEST EAX,EAX JZ error DEC EAX … DEVICE_NAME DB "\\.\PHYSICALDRIVE0",0 BUF RB 512 ; буфер

Открыв физический диск и убедившись в успешности этой операции, мы должны прочитать оригинальный MBR-сектор в буфер, перезаписать первые 1BBh байт, ни в коем случае не трогая Таблицу Разделов и сигнатуру 55h AAh (мы ведь не хотим, чтобы диск перестал загружаться, верно?). Остается записать обновленный MBR на место и закрыть дескриптор устройства. Все! После перезагрузки все изменения вступят в силу, а может быть и не вступят… Загрузчик жестоко мстит за малейшие ошибки проектирования и чтобы не потерять содержимое своих разделов, для начала лучше попрактиковаться на VM Ware или любом другом эмуляторе PC.
Под Windows 9x, кстати говоря, трюк с CreateFile не работает. Но там можно воспользоваться симуляцией прерываний из DMPI или обратится к ASPI-драйверу. Оба способа подробно описаны в моей книге "Техника защиты компакт-дисков от копирования", фрагмент которой прилагается к журналу. И хотя в ней речь идет о CD, а не о HDD, жесткие диски программируются аналогичным способом.

отладка загрузчика
Отлаживать код загрузчиков невероятно трудно. Загрузчик получает управление задолго до запуска операционной системы, когда никакие отладчики еще не работают. Несколько лет назад это представляло огромную проблему и при разработке навороченных загрузчиков приходилось либо встраивать в них интегрированный мини-отладчик, либо выискивать ошибки руками, головой и карандашом. С появлением эмуляторов все изменилось. Достаточно запустить BOCHS и отлаживать загрузчик как и любую другую программу!

заключение
Программирование загрузчиков — одна из тех немногих областей, в которых применение ассемблера действительно оправдано. Языки высокого уровня для этого слишком абстрагированы от оборудования и недостаточно гибки. Вот почему хакеры так любят возиться с загрузчиками, добавляя сюда множество новых фич таких например, как: автоматическая загрузка с CD-ROM или SCSI-винтов, противодействие вирусам, парольная защита с шифрованием данных и т.д. Здесь действительно есть где развернуться и показать себя. Но читать о новых идеях скучно и неинтересно. Намного приятнее генерировать их самостоятельно. Так чего же мы сидим?!

Комментарии

отсутствуют

Добавление комментария


Ваше имя (на форуме):

Ваш пароль (на форуме):

Комментарии могут добавлять только пользователи,
зарегистрированные на форуме данного сайта. Если Вы не
зарегистрированы, то сначала зарегистрируйтесь тут

Комментарий: