อ่านบทความเบื้องหลัง paywall โดยปลอมตัวเป็น Googlebot
- หมวดหมู่: อินเทอร์เน็ต
อินเทอร์เน็ตเป็นจุดเปลี่ยน การบล็อกโฆษณาที่เพิ่มขึ้นอย่างต่อเนื่องได้ยุติรูปแบบรายได้ที่อาศัยเงินโฆษณาเพียงอย่างเดียวในการดำเนินการเว็บไซต์และธุรกิจ
โดยเฉพาะอย่างยิ่งเว็บไซต์ข่าวต่างๆได้เริ่มทดลองวิธีการกระจายแหล่งรายได้และตัวเลือกที่โดดเด่นตัวเลือกหนึ่งที่เว็บไซต์เช่น The Wall Street Journal, Financial Times, The New York Times, เวลา หรือวอชิงตันโพสต์ได้ดำเนินการหรือทดสอบคือระบบเพย์วอลล์
เพย์วอลล์มีหลายประเภท แต่มีเหมือนกันที่ปิดกั้นการเข้าถึงเนื้อหา สิ่งนี้อาจเกิดขึ้นโดยตรงเมื่อเปิดบทความแรกหลังจากอ่านบทความจำนวนหนึ่งบนไซต์แล้วหรือเป็นระบบที่ตัดตอนมาซึ่งแสดงย่อหน้าแรกให้ผู้อ่านและด้านล่างข้อมูลการสมัครเพื่ออ่านส่วนที่เหลือ
Paywall อาจไม่จำเป็นต้องให้ผู้ใช้จ่ายเงินเพื่อเข้าถึงเสมอไป บางไซต์อาจกำหนดให้ผู้ใช้สมัครใช้งานไซต์นี้ แต่จะไม่ชาร์จผู้ใช้เมื่อลงชื่อสมัครใช้แล้ว
อาจสมเหตุสมผลจากมุมมองทางธุรกิจและอาจให้ผลกำไรมากกว่าการต่อสู้กับผู้ใช้ที่เรียกใช้ adblockers แต่มีข้อเสียทั้งสำหรับไซต์ paywalled และผู้ใช้ที่ถูกบล็อก
ไซต์จะสูญเสียผู้เข้าชมเป็นเปอร์เซ็นต์สูงหากพวกเขาใช้ระบบเพย์วอลล์ ไม่มีความชัดเจนว่าเปอร์เซ็นต์นั้นสูงแค่ไหนและอาจแตกต่างกันไปในแต่ละไซต์ แต่ก็มีแนวโน้มที่จะสูงกว่าเปอร์เซ็นต์ของผู้เยี่ยมชมที่สมัครรับข้อมูลไซต์หลังจากที่ได้รับการเสนอตัวเลือกในการสมัครเพื่ออ่านบทความที่ต้องการ
สำหรับผู้ใช้อาจเป็นเรื่องน่าหงุดหงิดที่ต้องติดตามลิงก์ไปยังบทความที่ทำให้เกิดเสียงที่น่าสนใจเพียงเพื่อถูกบล็อกไม่ให้อ่านเมื่อทรัพยากรโหลดแล้ว เป็นเรื่องที่เสียเวลาสำหรับหลาย ๆ คนโดยเฉพาะอย่างยิ่งหากไม่มีการให้เนื้อหาใด ๆ ก่อนการสมัครหรือสมัครสมาชิก
ปลอมตัวเบราว์เซอร์ของคุณ
ไม่มีความลับใดที่เว็บไซต์ข่าวอนุญาตให้เข้าถึงผู้รวบรวมข่าวสารและเครื่องมือค้นหา ตัวอย่างเช่นหากคุณตรวจสอบ Google News หรือ Search คุณจะพบบทความจากเว็บไซต์ที่มี paywall อยู่ในรายการ
ในอดีตเว็บไซต์ข่าวอนุญาตให้เข้าถึงผู้เยี่ยมชมที่มาจากผู้รวบรวมข่าวรายใหญ่เช่น Reddit, Digg หรือ Slashdot แต่การปฏิบัตินั้นดูเหมือนจะดีพอ ๆ กับการตายในปัจจุบัน บางคนอาจยังอนุญาต แต่เป็นการลองผิดลองถูกและวิธีแก้ปัญหาอาจถูกปิดได้ทุกเมื่อ
เคล็ดลับอีกประการหนึ่งในการวางชื่อบทความลงในเครื่องมือค้นหาเพื่ออ่านเรื่องราวที่แคชไว้โดยตรงดูเหมือนจะไม่ทำงานอย่างถูกต้องอีกต่อไปรวมทั้งบทความในไซต์ที่มี paywall มักจะไม่ถูกแคชอีกต่อไป
เคล็ดลับ: ตรวจสอบส่วนเสริมต่อไปนี้ที่คุณอาจใช้เพื่อข้ามเพย์วอลล์:
User-Agent และ Referrer
คุณอาจสงสัยว่าไซต์บล็อกหรืออนุญาตให้เข้าถึงเนื้อหาของไซต์ได้อย่างไร วิธีการต่างๆได้รับการปรับปรุงในช่วงหลายปีที่ผ่านมาและไม่เพียงพอที่จะเปลี่ยนผู้อ้างอิงของเบราว์เซอร์เป็น https://www.google.com/ เพื่อให้สามารถเข้าถึงเนื้อหาของไซต์ได้อย่างเต็มที่อีกต่อไป
แต่ไซต์จะใช้การตรวจสอบต่างๆซึ่งรวมถึงตัวแทนผู้ใช้ผู้อ้างอิงและคุกกี้และบางครั้งอาจมากกว่านั้นเพื่อตรวจสอบความถูกต้องของการเข้าถึง
ข้อมูลทั่วไป
อาจเป็นวิธีที่ดีที่สุดในการปลอมเบราว์เซอร์คือทำให้ดูเหมือนว่าเป็น Googlebot
- ผู้อ้างอิง: https://www.google.com/
- User-Agent: Mozilla / 5.0 (เข้ากันได้; Googlebot / 2.1; + http: //www.google.com/bot.html
โปรดทราบว่าตัวเลือกนี้ใช้ไม่ได้อีกต่อไปในไซต์พฤษภาคม อาจจะดีกว่าถ้าพยายามปลอมตัวว่ามาจาก Twitter หรือเว็บไซต์โซเชียลมีเดียอื่น ๆ
Firefox
ผู้ใช้ Firefox ต้องการโปรแกรมเสริมของเบราว์เซอร์สองตัวสำหรับสิ่งนั้นตัวแรก RefControl เพื่อเปลี่ยนค่าผู้อ้างอิงเมื่อเยี่ยมชมไซต์ข่าวที่สอง User Agent Switcher เพื่อเปลี่ยนตัวแทนผู้ใช้ของเบราว์เซอร์
ปรับปรุง : RefControl ไม่สามารถใช้ได้อีกต่อไป คุณอาจ ลองดู ทางเลือกแทน ปลาย
- ดาวน์โหลดและติดตั้งส่วนขยายทั้งสองในเว็บเบราว์เซอร์ Firefox
- แตะที่ปุ่ม Alt และเลือก Tools> RefControl Options
- คลิกที่ 'เพิ่มไซต์' ป้อนชื่อโดเมนใต้ไซต์เลือกการดำเนินการที่กำหนดเองและป้อน https://www.google.com/ เป็นผู้อ้างอิง
- ทำซ้ำกับไซต์ข่าวสารทั้งหมดที่คุณต้องการเข้าถึง (บางเว็บไซต์อาจใช้ไม่ได้แม้ว่าคุณจะทำการเปลี่ยนแปลงก็ตามดังนั้นโปรดจำไว้ว่า)
- เมื่อเสร็จแล้วให้ปิดหน้าต่างกำหนดค่า
- แตะที่ปุ่ม Alt อีกครั้งและเลือก Tools> Default User Agent> Edit User Agents จากเมนู
- เลือกใหม่> User Agent และแทนที่สตริงในฟิลด์ User Agent ด้วย Mozilla / 5.0 (เข้ากันได้ Googlebot / 2.1; + http: //www.google.com/bot.html) ตั้งชื่อว่า Googlebot
- ออกจากเมนู
- ก่อนที่คุณจะเข้าถึงไซต์เหล่านี้ให้แตะที่ Alt แล้วเลือก Default User Agent> Googlebot
ทั้งหมดนี้มีให้ เป็นเรื่องที่น่าเสียดายเล็กน้อยที่ไม่มีส่วนขยายสำหรับ Firefox ที่เปลี่ยนตัวแทนผู้ใช้โดยอัตโนมัติตามไซต์ที่คุณเยี่ยมชม
Google Chrome
ผู้ใช้ Google Chrome สามารถติดตั้งส่วนขยายเช่น User Agent Switcher และ การควบคุมผู้อ้างอิง ที่มีให้เบราว์เซอร์ทำเช่นเดียวกัน
อย่างไรก็ตามมีความเป็นไปได้อื่นและนั่นคือการสร้างส่วนขยายที่กำหนดเองซึ่งทำให้กระบวนการในเบราว์เซอร์เป็นไปโดยอัตโนมัติ
มีคำแนะนำใน Elaineou . โดยพื้นฐานแล้วสิ่งที่ต้องทำก็คือการสร้างไดเร็กทอรีใหม่บนคอมพิวเตอร์ในระบบสร้างไฟล์ background.js และ manifest.json สองไฟล์ภายในไฟล์จากนั้นคัดลอกและวางโค้ดที่พบบนไซต์ลงในไฟล์
คุณต้องเปิดใช้งาน 'โหมดนักพัฒนา' บน chrome: // extensions / จากนั้นสามารถเลือก 'load unpacked extension' เพื่อเลือกโฟลเดอร์ที่คุณสร้างทั้งสองไฟล์เพื่อโหลดส่วนขยายใน Chrome
คุณสามารถแก้ไขรายชื่อไซต์ที่สนับสนุนเพื่อเพิ่มไซต์ใหม่