前言 在互联网上,事物的流行总是迅速的也是短暂的。如果某个受欢迎的博客稍微提到了一下你的网站,就能够立刻给你带去30万潜在顾客,人们都想要知道你是谁以及你能给他们带来什么。不过,如果你只是一个刚刚起步的小公司,那么你所拥有的硬件和软件则不大可能有本事应付如此大的流量。也许你已经很明智地建立了一个能够应付每小时3 万次访问的网站;在最初的6个月中,你实际的需要也就只是这样了。然而在大负载的时候,对于另外27万也想来随便瞅瞅的用户而言,这样的系统慢得让你甚至连公司的标志都显示不出来。而且,那些潜在客户也不大可能会在负载趋于平稳之后再回来。
最好不要一开始就花费时间和金钱去构建能够满足数百万访客的系统,因为那些系统在随后的几个月中都只需要应付每天几千的访客量而已。然而,如果你推迟了构建大系统的工作,那么你又可能会错过利用顾客反馈改进产品的机会。在允许顾客使用产品之前就构建大系统,搞不好会弄出客户不想要的东西。
小公司通常无法在刚开始的时候就得到一大堆的服务器。他们所能做的,就是先构建一个小的,然后祈祷那些可能出现的系统崩溃不会毁掉他们好不容易积累起来的声誉。运气好的呢,会找到他们的知音,拿到新一轮的投资,停掉功能开发并重建其产品以应对更大的负载;而那些运气不好的呢,呃,那就不好说了。
不过,现在有了另外一些选择。诸如Amazon.com以及Microsoft之类的大型互联网企业正在通过一种按使用付费的模式出租他们的大容量系统。你的网站得到这些大型系统的支持,就能够轻松处理流量上的突发峰值。此外,由于只需为实际使用的资源付费,所以在流量较低的时候不会出现前期投资浪费的情况。只有当你的客户基数变大以后,成本才会相应地增加。
GAE(G公司的应用程序托管服务)绝不只是提供了硬件那么简单。它还提供了一种用于构建可自动扩展的应用程序的模型。由于是App Engine在运行你的应用程序,因此, 无论是几十个并发用户还是成千上万个,每个用户在访问它时都会得到与其他用户相同的体验。你的应用程序将会用上G公司为自己的应用程序所提供的数据存储和检索、缓存、网络访问等大型服务。App Engine会自动处理大型计算任务,比如负载平衡、数据复制以及容错等。
传统系统总是会成长到无法再使用其第一个数据库服务器的时候,App Engine模型则真正解决了这一问题。对于传统系统而言,添加一些负载平衡的Web服务器和缓存层的确可以缓解这一问题,不过当应用程序需要向多个地方写数据时,你就会遇到大麻烦了。
如果开发工作依赖于数据库软件的某些特性,而这些数据库软件又从来没想过要把数据分布到多台机器,那么麻烦就更大了。如果预先以App Engine的模型来考虑数据,那么你就不用再花费额外的精力去重建整个系统。
“运行在G公司的基础架构上”意味着你无须架设任何服务器,也不需要更换坏掉的硬盘或是查找网卡上的故障。你再也不会在大半夜被疯了似的手机吵醒,而原因只是一个ISP小故障被误认为是服务警报。另外,由于有了自动伸缩的能力,你也不必再为流量的增加而手忙脚乱地添置新硬件了。
GAE使你能够将注意力集中在应用程序的功能和用户体验上。你可以尽早地开展业务,享受有如洪水泛滥般的关注度,留住用户,并在用户的帮助下改进你的产品。应用程序将随着受众数量的增长而不断成长,完全不需要重新建立新的架构。然而与此同时,你的竞争对手还在到处救火和配置数据库呢。
通过本书,你将会学到如何开发能够运行于GAE的应用程序,以及如何最大限度地发挥这个可扩展模型的作用。本书着重介绍了App Engine的可扩展数据存储区,它跟关系型数据库不同,后者在过去十年中是Web开发的主力军。把这个应用程序模型和数据存储区放到一起就得到了一种全新的Web应用程序开发模型;也就是说,在与我们所熟知的模型几乎一样简单的前提之下,我们需要重新考虑一些原本是理所当然的原则。
本书介绍了App Engine的主要特性,包括可扩展的服务(比如用于发送电子邮件和操作图片)、用于部署和管理应用程序的工具,还有那些使你能够通过自定义域名将应用程序跟GAccount和Apps集成起来的功能。本书还将讨论一些其他的技术,比如应用程序优化、使用任务队列和离线处理等,以及其他一些能让GAE发光发热的技术。
使用本书 直到编写本书时,App Engine共支持两类用于构建Web应用程序的技术:Java和Python。Java技术类使你在开发Web应用程序时可以使用Java编程语言(或者是其他能够编译为Java字节码的语言,还可以是那些拥有基于JVM的解释器的语言)以及诸如servlet和JSP之类的Java Web技术。Python技术类提供了一个针对Python编程语言的快速解释器,且兼容许多主流开源Web应用程序框架(如Django)。
本书涵盖了这两类技术的知识,还有一些特定于语言的重要主题。如果已经决定了要使用哪种语言,那么你可能会对跟这种语言无关的信息不感兴趣。但是,这对一本图书来说实在是一个挑战:要如何组织文字才能让一种技术的信息不会影响到另一种呢?
首先,我们试图按照所有App Engine应用程序都会涉及的主要知识点对章节进行组织。只要有需要,我们就会把章划分成单独的节以针对每种语言进行单独的讲解。如果某个示例所阐述的知识点在两种语言中都很相似,那么该示例就会以Python的形式给出。如果Python并不是你所喜欢的编程语言,那么也可以从本书其他部分或是App Engine的官方文档中找到相关的信息。
数据存储区是一个较大的主题,只是这个就占了好几章。从第4章开始,我们将同时使用Python和相应的Java API来介绍数据存储区的知识。注意,我们将使用一种非传统的方式来介绍数据存储区API,首先介绍的将是与数据存储区概念直接相关的低级API。在应用程序中,也许你更喜欢数据建模方面的高级API。数据建模是分别针对两种语言进行讨论的:第7章针对Python,第8章针对Java。
G公司也许会在未来发布针对其他语言的技术类。如果在你阅读本书的时候他们已经那样做了,那么这里所讨论的知识也一样是派得上用场的。可以在本书的网站上找到未来版本的相关信息。
本书主要包括以下这些内容:
- 第1章 GAE简介
对GAE及其组件、工具和主要功能的高度概括。这一章还将大致介绍一下你可能希望GAE有而实际上暂时还没有的功能。
- 第2章 创建一个应用程序
关于Python和Java的入门教程,包括如何设置开发环境、设置账户和域名、把应用程序部署到App Engine等。教学应用程序演示了如何利用几个App Engine功能实现Web应用程序所常用的模式:存储和检索用户的使用偏好。
- 第3章 处理Web请求
详细讲解App Engine的架构,以及一些关于前端、应用程序服务器和静态文件服务器的特性,同时还会详细介绍Python和Java的应用程序服务器运行时环境。前端将请求路由到应用程序服务器和静态文件服务器,并管理安全连接以及GAccount的认证和授权。这一章还会讨论配额和限制,以及如何通过设定预算来提高这些东西。
- 第4章 数据存储区实体
从这一章开始,接下来的几章都将讨论App Engine的数据存储区;它是一个强大的、带有本地事务支持的、可扩展的对象数据存储系统。这一章将介绍数据实体、键和属性,以及用于创建、更新和删除实体的Python和Java API。
- 第5章 数据存储区查询
介绍数据存储区查询和索引,以及用于查询的Python和Java API。App Engine的数据存储区查询引擎对所有查询都使用预先构建的索引。这一章将详细说明查询引擎的功能,以及各功能是如何使用索引的;还将讨论如何为应用程序的查询定义和管理索引。
- 第6章 数据存储区事务
如何利用事务来保持数据的一致性。App Engine数据存储区会在一个可扩展的环境中使用本地事务。应用程序以事务性为单位将实体组织起来,也就是实体组。这一章将详细介绍数据存储区是如何更新数据的,以及应该如何对你的数据和应用程序进行设计才能用好这些功能。
- 第7章 用Python进行数据建模
如何利用Python的数据建模API来实现数据架构的不变性。数据存储区本身是无架构的,这也是其可扩展性的根本。你可以通过App Engine的数据建模接口来自动地强制执行数据架构。这一章将只介绍Python,Java开发人员如果希望得到一些数据建模方面的建议,看看也无妨。
- 第8章 Java持久化API
简单介绍了Java持久化API(Java Persistence API,JPA)。它里面的那些内容是如何翻译给数据存储区的以及如何用它来建模数据架构。JPA是一个Java EE标准接口。App Engine还支持另外一种叫做Java数据对象(Java Data Objects,JDO)的标准接口,不过本书并没有介绍JDO。这一章专门介绍Java。
- 第9章 内存缓存
介绍App Engine的内存缓存服务(也就是memcache)及其Python和Java API。强制缓存对高性能Web应用程序而言是必不可少的。
- 第10章 获取URL和Web资源
如何利用URL Fetch服务通过HTTP访问互联网上的其他资源。这一章涵盖了Python 和Java的接口,包括标准的URL获取库实现。这一章还将介绍异步URL Fetch接口(在编写本书的时候,它只能用于Python)。
- 第11章 收发电子邮件和即时消息
如何通过App Engine的服务向兼容于XMPP的服务(比如GTalk)发送电子邮件和即时消息。这一章将介绍如何使用请求处理器来接收由App Engine转发的电子邮件和XMPP聊天消息。此外,还将讨论如何利用API中的工具来创建和处理消息。
- 第12章 大批量数据处理和远程访问
如何在本地计算机上运行脚本去完成在线应用程序中的大型维护工作。SDK中的工具可以使你在备份、恢复、加载和检索应用程序数据存储区中的数据时更加轻松。你也可以利用远程访问API编写自己的工具以实现数据转换或其他功能。你还可以通过一个交互式Python命令行shell程序(也用到了远程API)去控制在线的Python 或Java应用程序。
- 第13章 任务队列和计划任务
如何使用任务队列来完成除请求处理以外的其他工作。任务队列通过在多个应用程序服务器上运行代码的方式来实现任务的并行处理。你可以通过配置文件控制具体的处理速率。任务还可以按照时间表执行,无须用户干预。
- 第14章 Web应用程序框架:Django
如何在Python运行时环境中使用Django这个Web应用程序框架。这一章将讨论如何建立Django项目,如何使用Django App Engine Helper,以及如何通过Django App Engine Helper用上Django的功能(比如在表单和Test Fixture译注1中使用App Engine 的数据建模接口)。
- 第15章 部署和管理应用程序
如何上传应用程序并在App Engine上运行,如何根据版本对应用程序进行更新和测试,如何管理和检查运行中的应用程序。这一章还将介绍Administrator Console的其他管理功能,比如账单管理等。最后我们还会给出一些便于你获取帮助和深入学习的网站。
本书约定 本书所使用的排版约定如下:
斜体(Italic)
表示新的术语、URL、电子邮件地址、文件名以及文件扩展名。
等宽字体(Constant width)
用于程序代码清单,也用在段落中以引用变量、函数名、数据库、数据类型、环境
变量、语句和关键字等程序元素。
等宽粗体(Constant width bold)
用来显示用户需要逐字输入的命令或其他文本。
等宽斜体(Constant width italic)
用来显示需要以用户给出的或由上下文决定的值来代替的文本。
使用示例代码
本书的目的是协助你完成工作。一般来说,可以将本书中的代码用到你自己的程序或文档中。除非你要对代码的关键部分的文字做较大的改动,否则无需征得我们的许可。
比如说,使用本书中的大量代码编写一个程序是不需要许可的,而出售或发布含有 O’Reilly图书中的示例的CD-ROM则是需要许可的;援引本书及其示例代码以回答某个问题是不需要许可的,而将本书中的大量代码添加到你的产品文档中则是需要许可的。
如果你在引用本书时给出出处,我们将不胜感激,但不强求你一定说明出处。出处通常包括书名、作者、出版商以及ISBN号,例如:“Programming Google App Engine by Dan Sanderson. Copyright 2010 Dan Sanderson,978-0-596-52272-8”。
如果你觉得你对这些示例代码的使用方式超出了正常使用的范围或上述许可,请随时通过permissions@oreilly.com与我们联系。
如何联系我们 请把你在阅读本书时遇到的问题发送给出版社:
美国:
O’Reilly Media, Inc.
1005 Gravenstein Highway North
Sebastopol, CA 95472
中国:
北京市西城区西直门南大街2号成铭大厦C座807室(100035)
奥莱利技术咨询(北京)有限公司
O’Reilly的每一本书都有专属网站,你可以在那里找到关于本书的相关信息,包括勘误列表、示例代码以及其他的信息。本书的网站地址是:
你也可以从作者的网站上下载示例代码:
若要询问本书中的相关技术问题,可以发送电子邮件到: bookquestions@oreilly.com
关于本书的更多信息、会议、资料中心和网站,请访问以下网站:
致谢 我欠App Engine团队的谢意实在是太多了,我也非常自豪能在2008年成为其中的一员。
感谢Paul McDonald、Pete Koomen,还有App Engine的项目组长Kevin Gibbs,如果没有他们的努力和领导,这本书将不会出版。
我要特别感谢一下App Engine数据存储区团队,他们在有关数据存储区的那几章中给予了我非常大的帮助。Ryan Barrett(首席数据存储区工程师)花了不少时间跟我交谈,还在技术方面做了详细的审阅。Max Ross(Java数据存储区接口以及JDO和JPA适配器的实现者)编写了第8章中的大部分内容。Rafe Kaplan(Python数据建模库的设计者)编写了第7章中的许多内容。感谢他们。
感谢Matthew Blain、Michael Davidson、Alex Gaysinsky、Peter McKenzie、Don Schwarz、Jeffrey Scudder仔细地审阅了本书中的相关内容。还要感谢Andy Smith在最后时刻改进了本书所讲的Django App Engine Helper。还有很多其他的App Engine 贡献者也直接或间接地促成了本书的面世:Freeland Abbott、Mike Aizatsky、Ken Ashcraft、Anthony Baxter、Chris Beckmann、Andrew Bowers、Matthew Brown、Ryan Brown、Hannah Chen、Lei Chen、Jason Cooper、Mark Dalrymple、Pavni Diwanji、Brad Fitzpatrick、Alfred Fuller、David Glazer、John Grabowski、Joe Gregorio、Raju Gulabani、Justin Haugh、Jeff Huber、Kevin Jin、Erik Johnson、Nick Johnson、Mickey Kataria、Scott Knaster、Marc Kriguer、Alon Levi、Sean Lynch、Gianni Mariani、Mano Marks、Jon McAlister、Sean McBride、Marzia Niccolai、Alan Noble、Brandon Nutter、Karsten Petersen、George Pirocanac、Alexander Power、Mike Repass、Toby Reyelts、Fred Sauer、Jens Scheffler、Robert Schuppenies、Lindsey Simon、John Skidgel、Brett Slatkin、Graham Spencer、Amanda Surya、David Symonds、Joseph Ternasky、Eric Tholomé、Troy Trimble、Guido van Rossum、Nicholas Verne、Michael Winton以及Wenbo Zhu。
还要感谢Dan Morrill、Mark Pilgrim、Steffi Wu、Karen Wickre、Jane Penner、Jon Murchinson、Tom Stocky、Vic Gundotra、Bill Coughran以及Alan Eustace。
对于O’Reilly,我将永远感激Michael Loukides,他对于一个新手作者总是提供好的建议并具有令人吃惊的耐心。让我们再合作一次吧!
阅读(1732) | 评论(0) | 转发(0) |