这篇文章非常粗略地讨论thttpd的工作pattern: Reactor.关于pattern和model的区别,这里不多解释,参考这个说法: M(odel)-VC pattern.关于pattern的更多资料,参考 http://www.enterpriseintegrationpatterns.com/ .

什么是Reactor

Reactor又称Dispatcher,用于同步IO,它逆置了常见的函数调用机制,也就是说, Application将一个service对应的handler注册到Reactor,当这个service需要被处理时(一般通过定时器来触发),Reactor主动调用handler.浅白一点说, 'Don't call us, we'll call you.' -- Hollywood principle.

在前面对Reactor的简单解释中,可以看到Reactor至少有下面几个组件:

  1. handle: service(read, write)对应的句柄,Linux下通常是file description.
  2. handler: service对应的回调函数,如 handle_read(), handle_write().
  3. demultiplexer: 多路复用机制,Linux下可以用select/(e)poll
  4. reactor: 注册/移除handler的统一界面,如: Reactor::register_handler(), Reactor::remove_handler().

废话少说,看一下Reactor pattern大概的样子:

int fd[MAX_FD]; //要素1

typedef int EventType;
typedef int HANDLER;

enum
{
	READ_EVENT = 1;
	WRITE_EVENT = 2;
	...
};

class CEventHandler //要素2
{
public:
	virtual void handle_read(HANDLER handle) = 0;
	virtual void handle_write(HANDLER handle) = 0;
	virtual HANDLER get_handle() const = 0;
	...
};

class CReactor //要素4
{
public:
	virtual void register_handler(HANDLER handle, CEventHandler *ceh, EventType et) = 0;
	virtual void remove_handler(HANDLER handle, CEventHandler *ceh, EventType et) = 0;
	void handle_events(struct timeval *tv);
	...
};

thttpd的Reactor pattern

thttpd是事件驱动(event-driven)的,它有效的避开了多线程附带的复杂不易维护(尤其是临界区)和上下文切换,将CPU从事件源中解放出来,无须block.关于Event driven,这里不多说.

现在看看thttpd很寒酸的Reactor pattern:

thttpd自身既是master,又是worker,matser代码是main(), worker代码是handle_read(),handle_write()等函数.thttpd使用Reactor pattern,但弃用了Reactor 要素4的reactor,也就是说,代码中根本就没有CReactor界面,这直接导致了要素2被散乱的硬编码到thttpd.c文件中,无需注册,也没有办法移除.对于thttpd这种HTTP服务器来说,要素1很自然的就是fd,而要素3 demultiplexer,在我的电脑上,configure thttpd代码时被选定为select.

以上,确实很粗略,哈哈哈. 其实thttpd里面有很多不错的小技巧,比如说watchdog,总结出来应该是很实用的 :p