|
Post by account_disabled on Jan 8, 2024 2:25:09 GMT -5
转到Screaming frog > 配置 > Spider > 渲染 > JavaScript 确保取消选中启用渲染页面屏幕截图的复选框 然后点击开始抓取 现在您的爬网已完成,您将需要将数据导出为 CSV。 进入尖叫青蛙 > 导出 现在您已经为您的网站准备了两个不同的 CSV 文件,一个用于纯文本版本抓取,另一个用于JS 渲染的抓取数据。 现在我们运行对 Pandas 的抓取来执行测试渲染 我们只考虑以下指标: 地址 状态码 字数 外链 独特的外链 WhatsApp 号码数据 内链 独特的链接 检查爬网之间的差异 因为这将意味着很多内容隐藏在JavaScript后面,无法从Google第一波爬行中访问。这样,你就可以借助Screaming Frog和Python找到所有渲染的JS文件了。PUSHSTATE 和 REPLACESTATE:您需要了解的内容 姓名 电子邮件地址 网址 在动态的 Web 开发世界中,创建用户友好且高效的 Web 应用程序是一项不断发展的挑战。 这一挑战的一个关键方面是有效管理浏览器历史记录。用户期望平滑的导航以及能够毫不困惑地回溯他们的步骤,这就是pushState() 和replaceState() 方法发挥作用的地方。 浏览器历史记录管理的意义 想象一下您正在浏览一个内容丰富的现代网站或单页应用程序。您探索各个部分,与动态内容交互,甚至可能过滤数据。当您执行此操作时,浏览器的地址栏会显示与您的操作相对应的不断变化的 URL。这是通过浏览器的历史记录管理实现的,它记录了您执行的每个步骤。 浏览器历史记录管理的意义在于提供无缝的用户体验。当用户单击后退或前进按钮时,他们希望返回到应用程序以前的状态。他们希望看到与以前相同的内容并处于相同的上下文中。在 Web 应用程序中实现这种流动性不仅以用户为中心,而且对于搜索引擎优化 (SEO) 和整体可用性也至关重要。 推送状态和替换状态 PushState 和 ReplaceState 方法 在本综合指南中,我们深入研究了在管理浏览器历史记录中发挥关键作用的两个 JavaScript 方法:pushState() 和 ReplaceState()。 这些方法是 HTML5 History API 的一部分,为开发人员提供了控制 Web 应用程序中导航和历史记录处理方式的工具。 读完本指南后,您将能够在 Web 开发项目中充分利用PushState() 和 ReplaceState() 的强大功能,从而提供无缝且用户友好的导航体验。 现在,让我们踏上这段旅程,了解这些方法的工作原理以及它们如何改变用户与 Web 应用程序交互的方式。无论您是经验丰富的 Web 开发人员还是刚刚进入该领域,本指南都将为增强您的 Web 应用程序和满足数字时代的用户期望提供宝贵的见解。 浏览器历史记录的基础知识 在我们深入研究 PushState() 和 ReplaceState() 方法的复杂性之前,有必要通过了解浏览器历史记录的基本概念来打下坚实的基础。在本节中,我们将探讨什么是浏览器历史记录、它在用户导航中的作用以及它所解决的挑战和限制。 了解浏览器历史记录 最简单的浏览器历史记录是用户在浏览会话期间访问过的网页的记录。它类似于面包屑痕迹,允许用户追溯他们的步骤,并且它是网络浏览体验不可或缺的一部分。 当您访问网站时,您的浏览器会跟踪您查看过的页面,从而创建历史记录堆栈。该堆栈充当用户交互的历史记录。
|
|