Σελίδα 1 από 1

Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 3:04 pm
από mr.muffin
Γεια, απο εκπαιδευτικης φυσεως περιεργια, ξερει κανεις κανεναν αλγοριθμο για την "ανιχνευση" γραμματων ακομα και αν αυτα ειναι παραμορφομενα?

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 3:37 pm
από Virus•Hacker•Kontos
Απο οσο ξερω, δεν υπαρχει καποιος που θα βρισκει ολα τα recaptcha...
(Βγαζει νοημα γιατι αλλιως το internet θα ηταν γεματο απο spam bots)
Αλλα σε καθε περιπτωση χρειαζεσαι εναν πολυ δυνατο αλγοριθμο για να αναγνωριζει τι ειδους παραμορφωση εχουν τα γραμματα, γιατι ειναι απο γραμμες και αλλαγη χρωματος μεχρι και πολυ μεγαλυτερες παραμορφωσεις στο μισο γραμμα πχ google...

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 3:41 pm
από thanos713
Αναγνώριση εικόνας είναι στην ουσία...

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 7:39 pm
από chris
openCV

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 9:30 pm
από zaxeilasfc
Συμφωνώ με τον Chris. Εδώ και ώρα ψάχνομαι αλλά έχω βρεί κατι πράγματα σε python. Θα δώ αυτό που λεει και ο Chris και θα ξαναποστάρω μετά με περισσότερες πληροφορίες. Κοίταξε το και εσύ.

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 9:48 pm
από thetrojan01
Ναι, όπως είπε και ο chris, το OpenCV είναι μια πολύ πολύ καλή βάση :)

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 9:57 pm
από mr.muffin
Το εχω ψαξει και μερες τωρα προσπαθω να μου ερθει κατι, συμφωνα με το wikipedia, το μοναδικο πραγμα στο οπιο ειναι καλος ο ανθρωπος ειναι στο να "διαχωριζει" τα γραμματα μεταξυ τους, δηλαδη τα Segmentation. Και συγκεκριμενα ας κανω ενα quote:
Computer character recognition
A number of research projects have attempted (often with success) to beat visual CAPTCHAs by creating programs that contain the following functionality:
Pre-processing: Removal of background clutter and noise.
Segmentation: Splitting the image into regions which each contain a single character.
Classification: Identifying the character in each region.
http://en.wikipedia.org/wiki/CAPTCHA

Εγω σκεφτικα το εξης να κανω "scans" ανα μερικες σειρες απο πανω μεχρι κατω και απο τις ακρες καθε γραματος να περνω το μεσαιο σημειο. Καθε γραμα αν παρατηρησετε αν το "scannarete" εχει δικο του αριθμο τελειον, px το b διαβαζετε ως

*
*
* *
*

ολα τα γραματα ειναι μοναδικα εκτος απο το I το οπιο μπερδευτε με το l το D με το Ο και μερικα αλλα δεν θυμαμε τωρα. Αυτο ευκολα ξεπερνιετε χωρις επλεον συνθηκες καθως αν παρατηρησετε τα γραματα ειναι συμφωνα και φωνηεντα, δηλαδη πιο πολες πιθανοτητες εχω να ακολουθει συμφωνο μετα απο φωνηεν και φωνηεν μετα απο συμφωνο παρα το αντιθετο.

Επισης βρικα οτι τα γραματα ειναι συνδεμενα μεταξυ τους με μοτιβο το οποιο δεν ξερω πως να χρησημοποιησω... πχ τα γραμματα ειναι ενωμενα μεταξυ τους με σχεδον τελιες ευθεις. Μονο στο e εχω παρατηρησει οτι χρησημοποειτε διαγωνιος.

Και τελος θα αναπτυξω τον αλγοριθμο σε php οποτε μου ειναι περιτη η βιβλιοθηκη.

Καμια ιδεα?

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 10:43 pm
από chris
mr.muffin έγραψε:Το εχω ψαξει και μερες τωρα προσπαθω να μου ερθει κατι, συμφωνα με το wikipedia, το μοναδικο πραγμα στο οπιο ειναι καλος ο ανθρωπος ειναι στο να "διαχωριζει" τα γραμματα μεταξυ τους, δηλαδη τα Segmentation. Και συγκεκριμενα ας κανω ενα quote:
Computer character recognition
A number of research projects have attempted (often with success) to beat visual CAPTCHAs by creating programs that contain the following functionality:
Pre-processing: Removal of background clutter and noise.
Segmentation: Splitting the image into regions which each contain a single character.
Classification: Identifying the character in each region.
http://en.wikipedia.org/wiki/CAPTCHA

Εγω σκεφτικα το εξης να κανω "scans" ανα μερικες σειρες απο πανω μεχρι κατω και απο τις ακρες καθε γραματος να περνω το μεσαιο σημειο. Καθε γραμα αν παρατηρησετε αν το "scannarete" εχει δικο του αριθμο τελειον, px το b διαβαζετε ως

*
*
* *
*

ολα τα γραματα ειναι μοναδικα εκτος απο το I το οπιο μπερδευτε με το l το D με το Ο και μερικα αλλα δεν θυμαμε τωρα. Αυτο ευκολα ξεπερνιετε χωρις επλεον συνθηκες καθως αν παρατηρησετε τα γραματα ειναι συμφωνα και φωνηεντα, δηλαδη πιο πολες πιθανοτητες εχω να ακολουθει συμφωνο μετα απο φωνηεν και φωνηεν μετα απο συμφωνο παρα το αντιθετο.

Επισης βρικα οτι τα γραματα ειναι συνδεμενα μεταξυ τους με μοτιβο το οποιο δεν ξερω πως να χρησημοποιησω... πχ τα γραμματα ειναι ενωμενα μεταξυ τους με σχεδον τελιες ευθεις. Μονο στο e εχω παρατηρησει οτι χρησημοποειτε διαγωνιος.

Και τελος θα αναπτυξω τον αλγοριθμο σε php οποτε μου ειναι περιτη η βιβλιοθηκη.

Καμια ιδεα?
Για να το κάνεις αυτό θέλεις 1) Smoothing 2) Edge Detection 3) Line Detection και μετά 4) Letter Recognition. Ωραία τα λες παραπάνω, άντε να το υλοποιήσεις όμως. Αν πάντως το σκέφτηκες μόνος σου, ψάξτο, μάλλον θα υπάρχουν καλύτερες λύσεις.

Και η OpenCV δουλεύει και με php. Καλύτερα να την χρησιμοποιήσεις και θα έχεις το κεφάλι σου ύσηχο.

Πάντως να ξέρεις πως είναι γνωστό πως τα captcha σπάνε, δεν θα είναι κάτι επαναστατικό. Προσωπικά με συγκινεί περισσότερο το face detection...

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 21, 2011 10:51 pm
από thetrojan01
προσωπικά θα με συγκινούσε πάρα πολύ περισσότερο το fart detection. Να κάτι που δεν τολμούν πολλοί να κάνουν :lol:

Re: Recaptcha

Δημοσιεύτηκε: Τρί Φεβ 22, 2011 12:27 am
από mr.muffin
Συλογη στατιστηκων δεδομενων.... κατι πολυ ενδιαφερον προκυπτει!!! Τρεξτε το παρακατω σε php.

Κώδικας: Επιλογή όλων

<?php
$counter=0;
while($counter<1000000)
{
$url = "http://127.0.0.1/example-captcha.php";

$str = file_get_contents($url);
$str2 = explode('<iframe src="', $str);
$str =explode('" height="300"', $str2[1]);
$url = $str[0];
$str2 = file_get_contents($url);
$str = explode('<img width="300" height="57" alt="" src="', $str2);
$str2 =  explode('"></center>', $str[1]);
$contents= file_get_contents('http://www.google.com/recaptcha/api/'.$str2[0].'');
$myFile = 'images/image'.$counter.'.jpg';
$fh = fopen($myFile, 'w');
fwrite($fh, $contents);
$counter++;
}
?>
Οταν ζητουνται πολες εικονες αυτες μεταμορφονονται διαφορετικα εκανα upload μια εικονα να δειτε τι ενοω http://img88.imageshack.us/img88/6097/image52h.jpg

Υ.Γ. Για να τρεξεται το παραπανω σκριπτ πατε στο php.ini και αλλαξτε το max_execution_time σε 0

Re: Recaptcha

Δημοσιεύτηκε: Τετ Φεβ 23, 2011 1:49 pm
από kernelpanic
thetrojan01 έγραψε:προσωπικά θα με συγκινούσε πάρα πολύ περισσότερο το fart detection. Να κάτι που δεν τολμούν πολλοί να κάνουν :lol:
Υπάρχουν αισθητήρες συγκέντρωσης μεθανίου, και είναι αρκετά διαδεδομένοι στη βιομηχανία.

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 28, 2011 3:03 pm
από mr.muffin
Το οpencv δεν βοηθαει. Επισης εκανα αλγοριθμο για να βρισκω τα μεσαια σημεια απο τις ακρες και εδω ειναι ενα αποτελεσμαΕικόνα. Δεν ξερω ομως τωρα πως να το αξιοποιησω... καμια ιδεα?

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 28, 2011 3:46 pm
από chris
mr.muffin έγραψε:Το οpencv δεν βοηθαει. Επισης εκανα αλγοριθμο για να βρισκω τα μεσαια σημεια απο τις ακρες και εδω ειναι ενα αποτελεσμαΕικόνα. Δεν ξερω ομως τωρα πως να το αξιοποιησω... καμια ιδεα?
Εάν αυτό είναι edge detection, μέχρι εδώ έχω φτάσει κιεγώ :) Αλλά μάλλον κάτι σαν Point Detection, line detection και μετά Letter Recognition πρέπει να ακολουθήσει.

Re: Recaptcha

Δημοσιεύτηκε: Δευ Φεβ 28, 2011 4:09 pm
από Virus•Hacker•Kontos
Εμενα παντως η πρωτη λεξη στην εικονα δεν μου φερνει στο μυαλο κανενα γραμμα...

Re: Recaptcha

Δημοσιεύτηκε: Τρί Μαρ 01, 2011 3:05 pm
από mr.muffin
Chris σε εκανα add στο msn, μιας και φτιαχνεις και εσυ κατι παρομοιο μπορουμε να αλληλοβοηθουμε.

Re: Recaptcha

Δημοσιεύτηκε: Τρί Μαρ 01, 2011 8:55 pm
από kernelpanic
Virus•Hacker•Kontos έγραψε:Εμενα παντως η πρωτη λεξη στην εικονα δεν μου φερνει στο μυαλο κανενα γραμμα...
Πρέπει να τελειώνει σε "on" αλλά αυτή η λύση δε παίζει...

Δοκίμασε να κρατήσεις τα πρώτα και τελευταία σημεία μαυρίλας που υποδηλώνει γράμμα ως προς x,y,ή και τα δύο ;)

Υπάρxει ένα project που διαβάζει διάφορα είδη captcha με πολύ καλά ποσοστά επιτυχίας, αλλά δε θυμάμαι σελίδα.