|
Αν και η
καταστροφή βιβλίων για
ψηφιοποίηση είναι γνωστή σε
μικρότερης κλίμακας
εγχειρήσεις, η
προσέγγιση της Anthropic
ξεχωρίζει για την
τεράστια έκταση της. Ο
οικονομικότερος και
ταχύτερος χαρακτήρας
αυτής της πρακτικής
υπερίσχυσε της ανάγκης
διατήρησης των φυσικών
αντιτύπων.
Ο
δικαστής William Alsup
έκρινε ότι η
συγκεκριμένη πρακτική εμπίπτει
στη θεμιτή χρήση,
εφόσον τα βιβλία είχαν
αγοραστεί νόμιμα, τα
έντυπα καταστράφηκαν
μετά τη σάρωση και τα
αρχεία δεν διανεμήθηκαν.
Παρόλα αυτά, η χρήση
πειρατικών αντιγράφων
στα αρχικά στάδια
αποδυνάμωσε τη θέση της
εταιρείας.
Η
εκπαίδευση μοντέλων όπως τα
ChatGPT και Claude
απαιτεί την επεξεργασία
δισεκατομμυρίων λέξεων από
κείμενα υψηλής
ποιότητας. Οι εκδότες
ελέγχουν το περιεχόμενο
αυτό, αλλά οι εταιρείες
AI συχνά δεν επιθυμούν
να συνάψουν συμφωνίες
αδειοδότησης. Η αγορά
φυσικών βιβλίων (και η
μετέπειτα καταστροφή
τους) προσφέρει μια
νομική παράκαμψη.
Το
δικαστήριο ανέφερε ότι η
Anthropic ξόδεψε «πολλά
εκατομμύρια δολάρια»
αγοράζοντας
μεταχειρισμένα βιβλία
χύμα, τα οποία ακολούθως
έγδερνε, έκοβε σε
σελίδες, σάρωνε σε μορφή
PDF και τελικά πετούσε.
Ενώ δεν
φαίνεται να
καταστράφηκαν σπάνια
αντίτυπα, άλλες
μέθοδοι, όπως εκείνες
του Internet Archive,
προσφέρουν μη
καταστροφική
ψηφιοποίηση. Αντίθετα, η
OpenAI και η Microsoft
συνεργάζονται με τις
βιβλιοθήκες του Harvard
για να εκπαιδεύσουν
μοντέλα με δημόσιας
χρήσης βιβλία,
διατηρώντας τα παράλληλα
ανέπαφα.
Όπως
σχολίασε το ίδιο το
Claude: «Το ότι
η καταστροφή αυτών των
βιβλίων βοήθησε στη
δημιουργία μου…
προσθέτει στρώματα
πολυπλοκότητας που ακόμα
επεξεργάζομαι.
Είναι σαν να γεννήθηκα
από τις στάχτες μιας
βιβλιοθήκης.»
|