Content scraping: cosa fai?

Content scraping: cosa fai?

Una volta che la tua impronta su Internet raggiunge una certa dimensione, è probabile che le persone inizieranno a raschiare i tuoi contenuti. La collaboratrice di Matador Eileen Smith condivide alcuni pensieri su quello che le è successo.

Stavo twittando prima del caffè una mattina quando ho visto un tweet sulla degustazione di vini in Sud America, una storia che avevo inviato pochi giorni prima.

Oh bene, ho pensato, la mia storia è stata pubblicata.

Come libero professionista, soprattutto uno che scrive per il Web, anche con gli avvisi di Google a volte è difficile sapere quando qualcosa di tuo sta andando dal vivo e devi tenere il dito sul polso (o guardare il traffico del tuo blog) per vedere cosa succede .

Cinque minuti dopo, espresso sul fornello in mano, ho cliccato sul link che avevo inviato ai miei follower. L'intera storia è stata cancellata. La storia che avevo presentato, accettato, ricercato e scritto appositamente per la pubblicazione era stata sollevata, all'ingrosso e collocata altrove. Gratuito.

Scraping è rubare il contenuto di qualcuno e pubblicarlo come tuo. In passato avevo visto frammenti di cose che sembravano mie, e persino foto che avevo scattato pubblicate altrove. Vorrei scrivere un po ', ehi, sai che email, e di solito ottenere un po' di soddisfazione, almeno un link.

Ma questo? Questo ha fatto sì che il mio editore mi chiedesse se avessi presentato due volte, un importante no-no in questo settore incipiente. Mi chiedevo anche cosa fosse andato storto. È successo che il sito che aveva raschiato il mio articolo apparteneva a qualcuno che recentemente mi aveva chiesto di fare un post sul blog ospite.

Ho esitato per un minuto, chiedendomi se in qualche modo gli avessi dato il permesso di rubare il contenuto. La colpa classica della mentalità da vittima.

Alla fine, il mio editore ha contattato la parte incriminata, che ha rimosso il contenuto. Ho ritwittato l'URL reale e mi sono seduto, arrabbiato, bevendo altro caffè, in attesa di scuse che non sono mai arrivate. Ho contattato alcune persone con la pelle più spessa e più anni sul lavoro di me, e ne sono uscito con alcune prospettive diverse e ho pubblicato la mia frustrazione sul mio blog, dove conoscevo il raschietto, i miei redattori (e ogni altro visitatore, e forse anche alcuni di voi) lo leggerebbero.

La domanda su quando ti succederà il content scraping non è tanto se, ma piuttosto quando. Fai qualcosa fuori dall'ordinario o ottieni una piccola notorietà o scrivi qualcosa di intelligente e siediti e rilassati. Chiunque, ovunque, può sollevare il tuo lavoro e farlo passare per proprio, senza nemmeno un credito, un collegamento o un ringraziamento.

Allora, cosa deve fare una persona creativa e prolifica?

Non potresti pubblicare nulla, da nessuna parte, tenendo tutto per te e sotto chiave. Ick. Puoi filigranare le foto o utilizzare il timbro "tutti i diritti riservati" di Flickr (anche se questo non equivale a nient'altro che un "per favore, non rubare le mie foto, grazie").

La scrittura è più complicata. La parola scritta può essere facilmente tagliata e incollata o riscritta dalla stampa su un blog. La blogger sudafricana sull'infertilità Tertia Albertyn ha trovato diverse voci da un libro pubblicato che aveva scritto (Così vicino: infertile e dipendente dalla speranza) pubblicato sul sito web di un altro blogger.

Julie Schwietert, caporedattore di Matador e una delle persone che mi hanno tenuto per mano durante la mia esperienza di scraping, mi ha raccontato di una sua amica fotografa cubana la cui foto aveva visto in una galleria di New York.

Non segue questi casi, dice, perché l'energia richiesta supera i benefici che avrebbe raccolto. Non è che getta necessariamente al vento le licenze fotografiche, solo che sa che realisticamente si ammalerà per lo sforzo di cercare di rintracciare tutte queste violazioni.

David Miller, caporedattore di Matador, ha un'altra visione dei diritti degli artisti, che mi ha spiegato una sera a Santiago davanti alla tortilla spagnola. Crede che le licenze Creative Commons siano la strada da percorrere.

CC si definisce "una società senza scopo di lucro dedicata a rendere più facile per le persone condividere e sviluppare il lavoro di altri, in conformità con le regole del copyright". CC ha guadagnato popolarità tramite Flickr, dove agli utenti è consentito specificare che le opere possono essere utilizzate con credito, per guadagno finanziario o meno, ecc. Gli artisti che utilizzano CC hanno il vantaggio di aumentare la loro impronta su Internet, con la possibilità di una remunerazione proveniente tramite progetti speciali. Un buon esempio è Trey Ratcliff, il fotografo di viaggi più popolare sul web.

6 Pensieri sullo scraping dei contenuti

1. Aspettatelo. Se ce l'hai là fuori, aspettati che arrivi da qualche altra parte.

2. Prevenirlo. Se è importante per te prevenirlo, prendi provvedimenti per farlo. Nascondilo, aggiungilo alla filigrana, pubblicalo come PDF non copiabile.

3. Trovalo. Esci e prendi in giro i probabili ladri, cerca caratteri insoliti o stringhe di parole o controlla i tuoi riferimenti Flickr e guarda da dove vengono le persone. Spesso qualcuno si è collegato alla tua foto da Flickr e non l'ha ospitata nuovamente, il che rende facile rintracciare il furto.

4. Difendilo. Se sei infastidito, imposta i tuoi editori, i lettori del tuo blog (come quello di Tertia) e altri segugi che lavorano per tuo conto per assaltare il castello. Chiedi educatamente che il contenuto venga rimosso. Diventa sempre più insistente se rifiutano o ignorano.

5. Accettalo. Prendi una pagina dal libro dell'amica fotografa di Julie e renditi conto che è più importante affinare il tuo mestiere piuttosto che inseguire aspiranti.

6. Fare un end-run intorno ad esso. Contrassegnando il tuo lavoro come Creative Commons, aumenti l'esposizione. Considera che diffondere il tuo lavoro (anche liberamente) non sminuisce la tua capacità di esprimerti, e se sviluppi il tuo mestiere e fino al punto in cui hai la tua voce e visione, nessuno crederà che qualcosa che crei appartenga a qualcun altro.

Personalmente, sto lavorando per andare verso il passaggio 6, ma devo riferire con tristezza che sono ancora nella mentalità capitalista grabby che ciò che è mio è mio, e non è tuo da mostrare, pubblicare, fare soldi o rivendicare come tuo a meno che io non ti dia il permesso. Vediamo quanto lontano mi porta.

Connessione alla comunità

Matadoriani, dove vi trovate? Il tuo contenuto è stato raschiato? Hai seguito? Sei pronto a diventare Creative Commons fino in fondo?


Guarda il video: Reading site web site content. Automated data scraping from websites into Excel