Cum sa furi un milion (de posturi si site-uri)
Ma uitam eu intr-o zi pe hotnews dupa o stire si brusc, asa, mi-am dat seama ca site-ul lor e de cacat.
Nu e doar faptul ca arata de parca a fost facut in 1970 toamna. Nu e ca are reclame la toate colturile, inclusiv pe mobil. Nu e doar ca blocheaza orice browser fara adblock pe mobil. Nu. E pur si simplu un cacat pocnit.
Si stiti ce m-am intrebat eu brusc? Ba, da’ daca ar avea doar continutu’ si nu si jegul ala mizerabil? Oare cum ar arata?
Asta era acum vreo 3 zile. Si de vreo 2 zile ma chinui cu xmlrpc-ul pe python – doamne-fereste-ma – si cu “asta merge pe python2, dar pe python3 nu; astalalta invers”. Dar, intr-un final glorios, am facut ceva py-uri care sa aduca frumos continutul de-acolo si sa-l importe intr-un wordpress fara tot jegul (sarind peste faptul ca oricum stirile lor sunt niste jeguri). Da’ asa, fara jegurile lor de reclame, scripturi si plm-uri sinistre.
Asa c-am facut ceva robotel sinistru care sa ia frumos chestiile relevante de-acolo si sa le importe intr-un wordpress chior. Asa, de fun. WordPressu’ se poate vedea aici . Nu, nu i-am pus o tema, nu, nu l-am bibilit, nu, nu nimic. Nici macar nu m-am deranjat sa le ordonez dupa data. Ca pur si simplu nu merita efortul.
Parea asa, un exercitiu inutil, bun cel mult sa mai exersez nitel python. Da’ acum ca stau si ma gandesc, ii stiti p-aia care platesc lumea pentru continut? Gen 7 lei la un post sau cat zicea Cypress (plm, chiar nu-mi amintesc)? Este ca brusc, e mult mai simplu sa castigi aia 7 lei? Lasi dracia in cron sa ruleze o data la 10 minute, o configurezi sa ia chestiile de pe vreo 10 site-uri de profil (ce dracu’ profil o avand ala care te plateste) si dormi in timp ce-ti vin banii. Sau o faci pentru tine si bagi adsense. Stiu, haha, hihi, adsense, bani de ciunga. Asa e. Da’ facuti in timp ce dormi, de pe vreo 1000 de site-uri – sau, ma rog, cate domenii te tine buzunaru’? Heeeerpaderp.
Ma gandesc acum sa parsez cacaturile alea de stiri si sa inlocuiesc ceva cuvinte. Nu eu, normal, ca timpul meu e pretios. Ceva functie troglodita care sa inlocuiasca pe-acolo cuvinte random cu sinonime – pentru ca google. Sau as putea sa fur articole din presa mai spalata si sa le traduc automat gen google translate. Nu conteaza ca n-au sens, au keywords? Au. Asa-i ca deja am stofa de reporter? …daca nu chiar de blogger, ce dracu’.
Si cam asa am petrecut eu ultimele trei zile. Cu familia prin parc si cu pythonu’ p-acasa.
P.S In alta ordine de idei – nu ca mizeria asta ar fi altceva decat o banalitate – da, cam asa stau lucrurile cu automatizarea. Ii stiti p-aia cu “jobul meu e safe, ca necesita creativitate”? Aha. Cu rotine.
:))))
ai greșit cărăușii coa’
Well.. aparent nu esti primul care s-a gandit la asta. Vezi ziardebucuresti.ro a lui cetin.
Uăi, frumos, dar conținut duplicat. Sper că nu-ți indexează Google și ce parsează scriptul ăla.
firefox cu ublock origin merge fără probleme pe hotnews mobile
Hahaha! Acum 1 minut tocmai am intrat pe hotnews, ca am fantezii cu stiri irelevante. Se incarca asa de greu, ca un telefon cu bateria de 5 ani, incat am zis ca mai bine intru pe opencube, parca ala se incarca repede. Cand intru, dau de hotnews.
Nu, nu glumesc.
Ce mi se pare trist este ca hotnews este, totusi, cel mai reusit site de stiri din Romania.
Ți-ai putea face “ziar de Londra” , lol. Lăsând asta la o parte, dap, te-ai orientat bine. 120k+ dacă înveți ce te-ai apucat tu acum să faci.
Tu citesti presa din Romania? :)))) Mai bine fa un py sa scoata “n-o sa crezi ce s-a intamplat”, “afecteaza pe toti”, “uluitor” din titluri… Experiment interesant, deschizi un ziar, oricare si in paralel times new roman, la 1 minut schimbi tabul… mie mi se intampla sa nu mai deosebesc care e pe bune care e times new roman daca nu ma uit unde sunt :))))))) Asta e calitatea presei la noi.
Chiar ieri citeam pe CNN parca, in US isi fac astia griji ca noul val de automatizare a muncii pune in pericol cam 40% din joburi. Inclusiv in domenii middle-high gen economie. Ce ti-e ca face economistul lui peste un raport/o predictie ce ti-e ca ti-o face un program de prognoza care cauta destul de repede in n-spe DB.
Cu alte cuvinte…oare cati vor lucra in acelasi domeniu in care lucreaza astazi, peste 10 ani? Exceptand programatorii care sunt “asigurati”.
Pai sloboz, incepand de azi e asta al lui Manowar cu original content hot news. 🙂
BTW, sa-l bag la bookmarkuri? Il mentii? Ca bag pula, sterg hot news.
Am ras.
Programatorii sunt acum pe val fiindca lumea inca mai are impresia ca ce facem noi e magie sau daca nu magie, macar ceva, acolo, algoritmi super complecsi.
Ahahaha :))
mihai: shhhh 😀
This! Chiar sunt interesat de chestie și eu.
Donati (lol) un server cu ceva domeniu si se rezolva.
Eventual vi-l pun cu parola, sa-l vedeti doar voi. Pe-asta l-am oprit, ca nu vreau sa ajunga pe-aici aia care cauta stirile.
Dozer a dat un exemplu din zecile/sutele de site-uri care fix asta fac. Bine, se fură conținut de pe toate ziarele mari, nu doar HotNews.
Mda, numai ca la mine e automatizata chestia 100%.. si e facuta mai bine 🙂
Cui pula mea ii pasa de ce fac aia de la google? Ce-o sa faca, o sa-mi penalizeze site-ul in motoru’ lor de cautare? Gen n-o sa mai ajunga aici aia din Tulcea care tocmai cautau “cum sa ma fut in cur cu un vibrator”? Oh, noes…
@Mihai, nu mai spune la nimeni. Programatorii fac lucruri super avansate, iar aia care zic ca doar adapteaza solutii de pe StackOverflow sunt platiti de Soros.
@Manowar, ironic, dar ce vrei tu sa faci este exact de la ce hotnews a pornit: adunat stiri din alte surse sau rescrirea lor.
Da, boss. Dar eu o pot face mai bine si mai frumos…si in timp ce dorm 🙂
Imi poti da un reply pe mailul meu pentru domeniu si host ?
trimis.
…si acum ia stirile si de pe digi24. O sa-l opresc aici, ca treaba asta e asa, facuta-n scop educativ (asa, mai exersez eu diverse jeguri pe python), da’ cand/daca donati ceva domeniu/server, vi-l pun pe undeva, sa puteti citi (si comenta, lol) stirile lu’ peste prajit.
Mai e vreun site de stiri semi-relevant pe care sa-l pun la rand?
dollo.ro ? lolozaur
?
Python rulezzz!
stiripesurse.ro
antena3.ro
Name: Ionut
Trolling level: 1
news.ro
Poate-ar trebui sa gasesc pe careva sa le rescrie si sa deschid un nou site de stiri care sa poata fi citit fara sa blocheze telefonul, deeeerp.
Sau poate pun nlp-ul sa le rescrie. Sens n-ar avea, da’ ar fi atat de amuzant…
Ia, care vrei un job – sau cota parte lol – la furat?
RuneJaguar pari un băiat simplu de la țară.
http://www.digi24.ro/stiri/stirea-falsa-despre-moartea-unui-tanar-a-prabusit-tranzactiile-unei-monede-virtuale-767499
bi-tong
Eu îl folosesc pe ăsta:
https://play.google.com/store/apps/details?id=ro.aspinei.hotnewsro
Cu avantajul că înaintea unui zbor pot face save offline.
Nu l-am incercat (si nici nu intentionez).
Deocamdata, ma joc cu proiectul asta, vad eu mai incolo ce fac cu el…dar nu aplicatie de citit stirile offline, asta-i cert.
Am impresia ca ce urmaresti tu e article spinning. Sunt cativa algoritmi care pot sa faca un rewriting si sa pastreze semantica articolului. https://spinbot.com/ spre exemplu.