Lees artikelen achter paywalls door zich voor te doen als Googlebot

Probeer Ons Instrument Voor Het Oplossen Van Problemen

Het internet staat op een omslagpunt. De aanhoudende opkomst van adblocking heeft een einde gemaakt aan het verdienmodel dat uitsluitend afhankelijk is van advertentiedollars om websites en bedrijven te exploiteren.

Vooral nieuwssites zijn begonnen te experimenteren met manieren om inkomstenbronnen te diversifiëren, en een prominente optie is dat sites als The Wall Street Journal, Financial Times, The New York Times, de tijden , of The Washington Post hebben geïmplementeerd of getest, is het paywall-systeem.

Er zijn verschillende soorten betaalmuren, maar ze hebben allemaal gemeen dat ze de toegang tot inhoud blokkeren; dit kan direct gebeuren wanneer het eerste artikel wordt geopend, nadat een bepaald aantal artikelen ter plaatse is gelezen, of als een uittreksysteem dat de eerste alinea aan de lezer toont en daaronder de aanmeldingsinformatie om de rest te lezen.

Paywalls vereisen mogelijk niet altijd dat gebruikers geld betalen voor toegang. Sommige sites vereisen mogelijk dat gebruikers zich aanmelden om de site te gebruiken, maar zullen gebruikers niet opladen zodra ze zich hebben aangemeld.

news site paywall

Het is misschien logisch vanuit een zakelijk oogpunt en kan lucratiever zijn dan het uitvechten met gebruikers die adblockers gebruiken, maar er is een keerzijde aan zowel de betalende site als de geblokkeerde gebruiker.

Sites verliezen een hoog percentage bezoekers als ze een betaalmuursysteem implementeren. Het is onduidelijk hoe hoog het percentage werkelijk is, en het verschilt waarschijnlijk van site tot site, maar het is waarschijnlijk veel hoger dan het percentage bezoekers dat zich op de site abonneert nadat ze de keuze hebben gekregen zich te abonneren om het gewenste artikel te lezen.

Voor gebruikers kan het erg frustrerend zijn om een ​​link naar een interessant klinkend artikel te volgen om het lezen ervan te blokkeren zodra de bron is geladen; het is voor velen tijdverspilling, vooral als er geen inhoud wordt verstrekt voordat ze zich aanmelden of abonneren.

Maskerade uw browser

Het is geen geheim dat nieuwssites toegang geven tot nieuwsaggregators en zoekmachines. Als u bijvoorbeeld Google Nieuws of Zoeken bekijkt, vindt u artikelen van sites met paywalls die daar worden vermeld.

In het verleden boden nieuwssites toegang aan bezoekers van grote nieuwsaggregators zoals Reddit, Digg of Slashdot, maar die praktijk lijkt tegenwoordig zo goed als dood te zijn. Sommigen staan ​​het misschien nog steeds toe, maar het is vallen en opstaan, en de tijdelijke oplossing kan op elk moment worden beëindigd.

Een andere truc, om de titel van het artikel in een zoekmachine te plakken om het gecachte verhaal erop direct te lezen, lijkt niet meer goed te werken en artikelen op sites met paywalls worden meestal niet meer in de cache opgeslagen.

Tip: bekijk de volgende add-on die u kunt gebruiken om paywalls te omzeilen:

User-agent en verwijzer

U vraagt ​​zich waarschijnlijk af hoe sites toegang tot de inhoud van de site blokkeren of toestaan. De methoden zijn in de loop der jaren verbeterd en het is niet langer voldoende om de verwijzer van de browser naar https://www.google.com/ te wijzigen om volledige toegang te krijgen tot de inhoud van een site.

In plaats daarvan gebruiken sites verschillende controles, waaronder user-agent, verwijzer en cookies, en soms zelfs meer dan dat, om de legitimiteit van toegang te bepalen.

Algemene informatie

Waarschijnlijk is de beste manier om de browser te maskeren, deze te laten lijken op Googlebot.

  • Verwijzer: https://www.google.com/
  • User-Agent: Mozilla / 5.0 (compatibel; Googlebot / 2.1; + http: //www.google.com/bot.html

Merk op dat de optie niet meer werkt op veel sites. Het is misschien beter om te proberen je voor te doen als afkomstig van Twitter of andere sociale mediasites.

Firefox

referrer

Firefox-gebruikers hebben daarvoor twee browser-add-ons nodig: de eerste, RefControl, om de verwijzende waarde te wijzigen bij het bezoeken van nieuwssites, de tweede, User Agent Switcher , om de user-agent van de browser te wijzigen.

Bijwerken : RefControl is niet langer beschikbaar. Je kan probeer dit alternatief. Einde

  1. Download en installeer beide extensies in de Firefox-webbrowser.
  2. Tik op de Alt-toets en selecteer Extra> RefControl-opties.
  3. Klik op 'site toevoegen', voer een domeinnaam in onder site, selecteer een aangepaste actie en voer https://www.google.com/ in als verwijzer.
  4. Herhaal dit voor alle nieuwssites die u wilt bezoeken (sommige werken mogelijk niet, zelfs niet als u de wijzigingen aanbrengt, dus houd daar rekening mee).
  5. Als u klaar bent, sluit u het configuratievenster.
  6. Tik nogmaals op de Alt-toets en selecteer Tools> Default User Agent> Edit User Agents in het menu.
  7. Selecteer Nieuw> User Agent en vervang de tekenreeks in het veld User Agent door Mozilla / 5.0 (compatibel; Googlebot / 2.1; + http: //www.google.com/bot.html). Noem het Googlebot.
  8. Verlaat het menu.
  9. Voordat u deze sites opent, tikt u op Alt en selecteert u Default User Agent> Googlebot.

Dit is alles wat er is. Het is een beetje jammer dat er geen extensie voor Firefox is die de user-agent automatisch verandert op basis van de sites die je bezoekt.

Google Chrome

Google Chrome-gebruikers kunnen extensies installeren zoals User Agent Switcher en Verwijzingscontrole die beschikbaar zijn voor de browser om hetzelfde te doen.

Er is echter nog een andere mogelijkheid, en dat is om een ​​aangepaste extensie te maken die het proces in de browser automatiseert.

Instructies worden gegeven op Elaineou . Het enige dat nodig is, is om een ​​nieuwe map op de lokale computer te maken, de twee bestanden background.js en manifest.json erin te maken en de code op de site te kopiëren en in de bestanden te plakken.

U moet de 'ontwikkelaarsmodus' inschakelen op chrome: // extensions / en kunt vervolgens 'laad uitgepakte extensie' selecteren om de map te kiezen waarin u de twee bestanden hebt gemaakt om de extensie in Chrome te laden.

U kunt de lijst met sites die het ondersteunt aanpassen om nieuwe toe te voegen.