目前典型的网页访问过程是以客户端发送请求、服务器响应并返回所请求的内容进行的。
如果要进行日志采集的动作,需要在服务器响应并返回所请求的内容之后,对应页面的onload
事件。 一般需要采集当前页面参数、浏览行为的上下文信息(如读取用户访问当前页面时的上一个页面)以及一些运行环境信息(如当前浏览器和分辨率等)。
正常情况下,在进入页面onload
生命周期的时候,向服务端发送日志信息。采集到的日志信息一般以URL参数的形式放在HTTP日志请求的请求行内。
日志服务器收到客户端发来的日志请求后,一般会立即向浏览器返回一个请求成功的响应,以免对页面的正常加载造成影响。
随着互联网业务的发展,仅了解用户访问过的页面已经远远不能满足用户细分研究的需求,在很多场景下,需要了解用户在访问某个页面时具体的互动行为特征。因为这些行为往往不会触发页面的特定事件,因此很多时候需要我们手动收集。
首先明确我们想要采集的数据-页面浏览日志和页面交互日志。正常情况下我们会在进入页面时发送日志信息,但是用户在每个页面的停留时间我们将很难统计到。因此考虑在离开页面时发送日志信息,并且在页面跳转时将上一个页面的一些信息也一并加入日志信息中。由于在离开页面时发送日志,因此还需要考虑监控客户端的异常关闭状态。