Привет.
Предлагаю подискутировать о процессной модели nginx. Раскуривал недавно исходники, хотелось прояснить пару философских моментов, которые мучают меня уже не первый год, и вот натолкнулся на эти моменты со spawn`ом воркеров.
Как известно, форк "наследует" кучу "мусора" из родительского процесса: обработчики сигналов, дескрипторы файлов\сокетов, переменные и т.п., словом, память стека и кучи. Так вот, как же избежать этого: "почистить" от родительской памяти форкнутый процесс нельзя, а юзать exec*() для запуска стороннего бинарника-воркера, который бы полностью заместил собой память форка - это значит делать второй, отдельный бинарник, что не так элегантно, как решение с одним исполняемым файлом nginx`а + fork().
Основной вопрос в том, что метод с fork() имеет сильную зависимость от родительского процесса. Например, если сначала добавить какие-нибудь обработчики сигналов в родителе, а потом форкнуть, nо дочерний процесс их унаследует, следовательно, форк подвержен значительным сайд-эффектам, и зависим даже от порядка кода в родительского процесса. Можно, конечно, условиться о порядке запуска, и о том, что делать "ататат" с копией чужой памяти нельзя, но это всё как то грустно выглядит, и вообще, нарушает принцип инкапсуляции.
Короче, хотелось бы услышать мнения о том, как же правильно организовывать многопроцессное приложение: fork() или fork() + exec() (ну или system()), преимущества и недостатки тех или иных подходов, и почему в nginx используется именно fork(), а не что то другое из вышеописанного.
Спасибо.