อ่านบทความเบื้องหลัง paywall โดยปลอมตัวเป็น Googlebot

ลองใช้เครื่องมือของเราเพื่อกำจัดปัญหา

อินเทอร์เน็ตเป็นจุดเปลี่ยน การบล็อกโฆษณาที่เพิ่มขึ้นอย่างต่อเนื่องได้ยุติรูปแบบรายได้ที่อาศัยเงินโฆษณาเพียงอย่างเดียวในการดำเนินการเว็บไซต์และธุรกิจ

โดยเฉพาะอย่างยิ่งเว็บไซต์ข่าวต่างๆได้เริ่มทดลองวิธีการกระจายแหล่งรายได้และตัวเลือกที่โดดเด่นตัวเลือกหนึ่งที่เว็บไซต์เช่น The Wall Street Journal, Financial Times, The New York Times, เวลา หรือวอชิงตันโพสต์ได้ดำเนินการหรือทดสอบคือระบบเพย์วอลล์

เพย์วอลล์มีหลายประเภท แต่มีเหมือนกันที่ปิดกั้นการเข้าถึงเนื้อหา สิ่งนี้อาจเกิดขึ้นโดยตรงเมื่อเปิดบทความแรกหลังจากอ่านบทความจำนวนหนึ่งบนไซต์แล้วหรือเป็นระบบที่ตัดตอนมาซึ่งแสดงย่อหน้าแรกให้ผู้อ่านและด้านล่างข้อมูลการสมัครเพื่ออ่านส่วนที่เหลือ

Paywall อาจไม่จำเป็นต้องให้ผู้ใช้จ่ายเงินเพื่อเข้าถึงเสมอไป บางไซต์อาจกำหนดให้ผู้ใช้สมัครใช้งานไซต์นี้ แต่จะไม่ชาร์จผู้ใช้เมื่อลงชื่อสมัครใช้แล้ว

news site paywall

อาจสมเหตุสมผลจากมุมมองทางธุรกิจและอาจให้ผลกำไรมากกว่าการต่อสู้กับผู้ใช้ที่เรียกใช้ adblockers แต่มีข้อเสียทั้งสำหรับไซต์ paywalled และผู้ใช้ที่ถูกบล็อก

ไซต์จะสูญเสียผู้เข้าชมเป็นเปอร์เซ็นต์สูงหากพวกเขาใช้ระบบเพย์วอลล์ ไม่มีความชัดเจนว่าเปอร์เซ็นต์นั้นสูงแค่ไหนและอาจแตกต่างกันไปในแต่ละไซต์ แต่ก็มีแนวโน้มที่จะสูงกว่าเปอร์เซ็นต์ของผู้เยี่ยมชมที่สมัครรับข้อมูลไซต์หลังจากที่ได้รับการเสนอตัวเลือกในการสมัครเพื่ออ่านบทความที่ต้องการ

สำหรับผู้ใช้อาจเป็นเรื่องน่าหงุดหงิดที่ต้องติดตามลิงก์ไปยังบทความที่ทำให้เกิดเสียงที่น่าสนใจเพียงเพื่อถูกบล็อกไม่ให้อ่านเมื่อทรัพยากรโหลดแล้ว เป็นเรื่องที่เสียเวลาสำหรับหลาย ๆ คนโดยเฉพาะอย่างยิ่งหากไม่มีการให้เนื้อหาใด ๆ ก่อนการสมัครหรือสมัครสมาชิก

ปลอมตัวเบราว์เซอร์ของคุณ

ไม่มีความลับใดที่เว็บไซต์ข่าวอนุญาตให้เข้าถึงผู้รวบรวมข่าวสารและเครื่องมือค้นหา ตัวอย่างเช่นหากคุณตรวจสอบ Google News หรือ Search คุณจะพบบทความจากเว็บไซต์ที่มี paywall อยู่ในรายการ

ในอดีตเว็บไซต์ข่าวอนุญาตให้เข้าถึงผู้เยี่ยมชมที่มาจากผู้รวบรวมข่าวรายใหญ่เช่น Reddit, Digg หรือ Slashdot แต่การปฏิบัตินั้นดูเหมือนจะดีพอ ๆ กับการตายในปัจจุบัน บางคนอาจยังอนุญาต แต่เป็นการลองผิดลองถูกและวิธีแก้ปัญหาอาจถูกปิดได้ทุกเมื่อ

เคล็ดลับอีกประการหนึ่งในการวางชื่อบทความลงในเครื่องมือค้นหาเพื่ออ่านเรื่องราวที่แคชไว้โดยตรงดูเหมือนจะไม่ทำงานอย่างถูกต้องอีกต่อไปรวมทั้งบทความในไซต์ที่มี paywall มักจะไม่ถูกแคชอีกต่อไป

เคล็ดลับ: ตรวจสอบส่วนเสริมต่อไปนี้ที่คุณอาจใช้เพื่อข้ามเพย์วอลล์:

User-Agent และ Referrer

คุณอาจสงสัยว่าไซต์บล็อกหรืออนุญาตให้เข้าถึงเนื้อหาของไซต์ได้อย่างไร วิธีการต่างๆได้รับการปรับปรุงในช่วงหลายปีที่ผ่านมาและไม่เพียงพอที่จะเปลี่ยนผู้อ้างอิงของเบราว์เซอร์เป็น https://www.google.com/ เพื่อให้สามารถเข้าถึงเนื้อหาของไซต์ได้อย่างเต็มที่อีกต่อไป

แต่ไซต์จะใช้การตรวจสอบต่างๆซึ่งรวมถึงตัวแทนผู้ใช้ผู้อ้างอิงและคุกกี้และบางครั้งอาจมากกว่านั้นเพื่อตรวจสอบความถูกต้องของการเข้าถึง

ข้อมูลทั่วไป

อาจเป็นวิธีที่ดีที่สุดในการปลอมเบราว์เซอร์คือทำให้ดูเหมือนว่าเป็น Googlebot

  • ผู้อ้างอิง: https://www.google.com/
  • User-Agent: Mozilla / 5.0 (เข้ากันได้; Googlebot / 2.1; + http: //www.google.com/bot.html

โปรดทราบว่าตัวเลือกนี้ใช้ไม่ได้อีกต่อไปในไซต์พฤษภาคม อาจจะดีกว่าถ้าพยายามปลอมตัวว่ามาจาก Twitter หรือเว็บไซต์โซเชียลมีเดียอื่น ๆ

Firefox

referrer

ผู้ใช้ Firefox ต้องการโปรแกรมเสริมของเบราว์เซอร์สองตัวสำหรับสิ่งนั้นตัวแรก RefControl เพื่อเปลี่ยนค่าผู้อ้างอิงเมื่อเยี่ยมชมไซต์ข่าวที่สอง User Agent Switcher เพื่อเปลี่ยนตัวแทนผู้ใช้ของเบราว์เซอร์

ปรับปรุง : RefControl ไม่สามารถใช้ได้อีกต่อไป คุณอาจ ลองดู ทางเลือกแทน ปลาย

  1. ดาวน์โหลดและติดตั้งส่วนขยายทั้งสองในเว็บเบราว์เซอร์ Firefox
  2. แตะที่ปุ่ม Alt และเลือก Tools> RefControl Options
  3. คลิกที่ 'เพิ่มไซต์' ป้อนชื่อโดเมนใต้ไซต์เลือกการดำเนินการที่กำหนดเองและป้อน https://www.google.com/ เป็นผู้อ้างอิง
  4. ทำซ้ำกับไซต์ข่าวสารทั้งหมดที่คุณต้องการเข้าถึง (บางเว็บไซต์อาจใช้ไม่ได้แม้ว่าคุณจะทำการเปลี่ยนแปลงก็ตามดังนั้นโปรดจำไว้ว่า)
  5. เมื่อเสร็จแล้วให้ปิดหน้าต่างกำหนดค่า
  6. แตะที่ปุ่ม Alt อีกครั้งและเลือก Tools> Default User Agent> Edit User Agents จากเมนู
  7. เลือกใหม่> User Agent และแทนที่สตริงในฟิลด์ User Agent ด้วย Mozilla / 5.0 (เข้ากันได้ Googlebot / 2.1; + http: //www.google.com/bot.html) ตั้งชื่อว่า Googlebot
  8. ออกจากเมนู
  9. ก่อนที่คุณจะเข้าถึงไซต์เหล่านี้ให้แตะที่ Alt แล้วเลือก Default User Agent> Googlebot

ทั้งหมดนี้มีให้ เป็นเรื่องที่น่าเสียดายเล็กน้อยที่ไม่มีส่วนขยายสำหรับ Firefox ที่เปลี่ยนตัวแทนผู้ใช้โดยอัตโนมัติตามไซต์ที่คุณเยี่ยมชม

Google Chrome

ผู้ใช้ Google Chrome สามารถติดตั้งส่วนขยายเช่น User Agent Switcher และ การควบคุมผู้อ้างอิง ที่มีให้เบราว์เซอร์ทำเช่นเดียวกัน

อย่างไรก็ตามมีความเป็นไปได้อื่นและนั่นคือการสร้างส่วนขยายที่กำหนดเองซึ่งทำให้กระบวนการในเบราว์เซอร์เป็นไปโดยอัตโนมัติ

มีคำแนะนำใน Elaineou . โดยพื้นฐานแล้วสิ่งที่ต้องทำก็คือการสร้างไดเร็กทอรีใหม่บนคอมพิวเตอร์ในระบบสร้างไฟล์ background.js และ manifest.json สองไฟล์ภายในไฟล์จากนั้นคัดลอกและวางโค้ดที่พบบนไซต์ลงในไฟล์

คุณต้องเปิดใช้งาน 'โหมดนักพัฒนา' บน chrome: // extensions / จากนั้นสามารถเลือก 'load unpacked extension' เพื่อเลือกโฟลเดอร์ที่คุณสร้างทั้งสองไฟล์เพื่อโหลดส่วนขยายใน Chrome

คุณสามารถแก้ไขรายชื่อไซต์ที่สนับสนุนเพื่อเพิ่มไซต์ใหม่