Find Jobs
Hire Freelancers

138376 PHP text similarity calculator

N/A

Käynnissä
Julkaistu lähes 17 vuotta sitten

N/A

Maksettu toimituksen yhteydessä
I need a PHP script that calculates the "edit distance" between the contents of two text files, where "edit distance" is defined as the minimal number of word insertions, word deletions, word substitutions and words transpositions (these weighted x0.5) needed to transform the first one into the second one. Examples of program input (text 1, text 2, i.e. the content of the two text files) and output (edit distance): text 1: "THIS APPLE IS RED" text 2: "THIS IS RED" edit distance = 1 (1 word deletion) text 1: "THIS IS RED" text 2: "THIS APPLE IS RED" edit distance = 1 (1 word insertion) text 1: "THIS APPLE IS RED" text 2: "THIS CHERRY IS RED" edit distance = 1 (1 word substitution) text 1: "THIS APPLE IS RED" text 2: "THIS RED IS APPLE" edit distance = 0.5 (1 word transposition) text 1: "THIS APPLE IS RED" text 2: "APPLE RED" edit distance = 2 (2 word deletions) text 1: "THIS APPLE IS RED" text 2: "THIS RED APPLE IS GOOD" edit distance = 2 (1 word insertion + 1 word substitution) Requisites: - it must be fast (less than 1 minute to calculate the edit distance between two completely different 100KB text files ) - it must work with any text file of any lenght (smaller than 200KB...) Escrow offered. Demo appreciated. _____ Note: this "edit distance" that I want is similar to the Damerau-Levenshtein distance whose algorithm (in C) is reported is reported here: [login to view URL], with the main difference that this counts the number of diff. characters while I want to count the number of diff. words.
Projektin tunnus (ID): 1884550

Tietoa projektista

Etäprojekti
Aktiivinen 12 vuotta sitten

Haluatko ansaita rahaa?

Freelancerin tarjouskilpailun edut

Aseta budjettisi ja aikataulu
Saa maksu työstäsi
Kuvaile ehdotustasi
Rekisteröinti ja töihin tarjoaminen on ilmaista

Tietoja asiakkaasta

Maan ITALY lippu
Milano, Italy
5,0
69
Maksutapa vahvistettu
Liittynyt syysk. 14, 2006

Asiakkaan vahvistus

Kiitos! Olemme lähettäneet sinulle sähköpostitse linkin, jolla voit lunastaa ilmaisen krediittisi.
Jotain meni pieleen lähetettäessä sähköpostiasi. Yritä uudelleen.
Rekisteröitynyttä käyttäjää Ilmoitettua työtä yhteensä
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Ladataan esikatselua
Lupa myönnetty Geolocation.
Kirjautumisistuntosi on vanhentunut ja sinut on kirjattu ulos. Kirjaudu uudelleen sisään.