Το παιχνίδι όγκου: Ανασκόπηση βιβλίων για μεγάλα δεδομένα - έχει σημασία το μέγεθος και μικρά δεδομένα

Μια απατηλά ελαφριά εισαγωγή στα Big Data, όπου η τεχνητή νοημοσύνη κάνει τη βαριά σκέψη

βιβλίο τεχνολογίας, κριτική τεχνολογικού βιβλίου, Big Data: Does Size Matter review, small data review book, Timandra Harkness books, Martin Lindstrom books, virtual storage, book books, last books κυκλοφόρησεΟτιδήποτε συνδέεται λογικά με οτιδήποτε άλλο δημιουργεί δεδομένα και όσο πιο οικονομικά είναι μια οικονομία, τόσο πιο πλούσιες είναι αυτές οι συνδέσεις.

Big Data: Έχει σημασία το μέγεθος;
Συγγραφέας: Τιμάντρα Χάρκνες
Εκδότης: Bloomsbury Sigma
Σελίδες: 304
Τιμή: 499



Μικρά δεδομένα: Οι μικροσκοπικές ενδείξεις που αποκαλύπτουν τεράστιες τάσεις
Συγγραφέας: Martin Lindstrom
Εκδότης: Hachette India
Σελίδες: 245
Τιμή: 399



πώς λέγονται οι πράσινες ελιές

Η σύντομη απάντηση στην ερώτηση που τέθηκε στο εξώφυλλο του βιβλίου του κωμικού και προσηλυτισμού των μαθηματικών Τιμάντρα Χαρκς είναι: φυσικά, το μέγεθος δεν έχει σημασία. Δεν έχει ποτέ σημασία, εκτός από τις ταινίες King Kong και Godzilla. Σε όλα τα άλλα, η προσέγγιση έχει σημασία. Οι προσεγγίσεις Big Data καθορίζονται από εκτεταμένα κατανεμημένες και παράλληλες στρατηγικές αποθήκευσης και επεξεργασίας. Το μέγεθος του συνόλου δεδομένων είναι δευτερεύον, αλλά τα πράγματα αρχίζουν πραγματικά να βουίζουν όταν οι τόμοι υπερφορτωθούν.



Η Harkness, η οποία έχει ένα ευχάριστο ελαφρύ άγγιγμα, επισημαίνει ότι ο όγκος των δεδομένων εκεί έξω - τα οποία φαντάζεται ως terabyte σκληροί δίσκοι συσκευασμένοι σε βαλίτσες σε καρότσι αποσκευών αεροδρομίου - αυξάνεται τόσο γρήγορα που οι αριθμοί είναι ξεπερασμένοι από τη στιγμή που είναι που δημοσιεύθηκε. Οτιδήποτε συνδέεται λογικά με οτιδήποτε άλλο δημιουργεί δεδομένα και όσο πιο οικονομικά είναι μια οικονομία, τόσο πιο πλούσιες είναι αυτές οι συνδέσεις. Εάν μια ταξιδιωτική κάρτα επαναφορτιστεί από ένα ηλεκτρονικό πορτοφόλι που είναι συνδεδεμένο με έναν τραπεζικό λογαριασμό και έναν αριθμό κινητού (ο οποίος αναφέρει συνεχώς τα δεδομένα κλήσεων και τοποθεσίας), δημιουργούνται αρκετά δεδομένα για να προφίλ στον ιδιοκτήτη.

Η καμπύλη θα γίνει πιο απότομη καθώς ξεκινά το Διαδίκτυο των Πραγμάτων. Αυτοκίνητα που συνδέονται με το Διαδίκτυο, ψυγεία, ετικέτες αποσκευών, παλέτες αποστολής και τα παρόμοια θα παράγουν δεδομένα όπως αφρός και γράφονται αλγόριθμοι για την εξόρυξή του. Εδώ βρίσκεται η κύρια λειτουργική διαφορά μεταξύ των παραδοσιακών στατιστικών μεθόδων και των προσεγγίσεων μεγάλων δεδομένων: οι τελευταίες εξαρτώνται πλήρως από την τεχνητή νοημοσύνη που μαθαίνει όσο προχωρά. Το διδάσκετε πρώτα στα στοιχειώδη στοιχεία της αναγνώρισης προτύπων και καθώς βελτιώνεται, θεωρητικά θα πρέπει να φτάσει σε ένα σημείο όπου να διαπερνά τα δεδομένα, αναζητώντας μοτίβα που δεν περιμένατε να βρείτε, αλλά θα σας ενδιέφεραν.



Είναι ενδιαφέρον ότι η ανθρώπινη ευφυΐα του γκουρού μάρκας Martin Lindstrom αναζητά μάλλον παρόμοια μοτίβα. Δεδομένου ότι απορρίπτονται από αρκετά μικρά σετ δειγμάτων, τα συμπεράσματά του μπορεί να αντιμετωπιστούν ως ανέκδοτα ή ως διορατικά, ανάλογα με τη χρησιμότητά τους. Στην πρώτη κατηγορία είναι η εξαιρετική παρατήρησή του ότι οι ταξιδιώτες επαγγελματίες στα αεροδρόμια τείνουν να έχουν τις κάρτες επιβίβασής τους στραμμένες προς τα κάτω στις τσέπες τους. Επειδή θέλουν να αποκρύψουν το γεγονός ότι πετούν οικονομικά. Αυτό έχει εξαιρετική αξία ψυχαγωγίας, αλλά καμία χρησιμότητα. Αυτή η τιμή πηγαίνει στην παρατήρηση του Lindstrom που προφανώς έστρεψε το Lego, το οποίο έχανε έδαφος από την άμεση ικανοποίηση που προσέφερε το ψηφιακό gaming. Ρώτησε έναν 11χρονο θαυμαστή του Lego ποια ήταν η πιο πολύτιμη κατοχή του. Αποδείχθηκε ότι ήταν ένα ζευγάρι παλιά πάνινα παπούτσια με σκασίματα ακριβώς στη σωστή γωνία για να ανακοινώσουν στον κόσμο ότι ο ιδιοκτήτης τους ήταν πρωταθλητής πατινάζ. Από ικανοποίηση, η Lego έστρεψε το ενδιαφέρον της σε ορατές αποδείξεις επίτευξης, όπως τα ακριβά μοντέλα του Millennium Falcon με τα οποία παίζουν ακόμη και οι ενήλικες.



ποια είναι μερικά φυτά στην έρημο

Εντυπωσιακά, η Lindstrom δεν εμπιστεύεται τα Big Data. Γιατί μια από αυτές τις μέρες, η AI θα αντικαταστήσει τους γκουρού των ανθρώπων. Η αναγνώριση προτύπων είναι πολύ πιο αξιόπιστη από τη διορατικότητα. Είναι μια έμφυτη ανθρώπινη ικανότητα την οποία μαθαίνουν τώρα οι μηχανές. Ο Harkness παραπέμπει στο πρωτοποριακό έργο του Βρετανού επιδημιολόγου John Snow, ο οποίος χρησιμοποίησε στατιστικές τεχνικές για να εντοπίσει το ξέσπασμα της χολέρας του 1854 στο Λονδίνο σε μια μόνο αντλία χειρός στο Soho. Σήμερα, οι τεχνητές νοημοσύνη τσακίζουν την Google για ιατρικές συμβουλές, από τις οποίες χαρτογραφούν τα κύματα των επιδημιών που πλησιάζουν, δίνοντας στις υπηρεσίες υγείας στρατηγικό βάθος. Τα Big Data χρησιμοποιούνται ήδη από εταιρείες και κυβερνήσεις και θα επηρεάσουν τον κόσμο μας με τρόπους ακόμα αδιανόητους. Αν είναι ευγενικό, θα παραμείνει χώρος για ανθρώπινη διορατικότητα.