apertium-fr-es-0.9.2~r61322/ 0000755 0001750 0001750 00000000000 12556573740 014712 5 ustar kartik kartik apertium-fr-es-0.9.2~r61322/es-fr-supervised.make 0000644 0001750 0001750 00000004634 12556573740 020763 0 ustar kartik kartik TAGGER_SUPERVISED_ITERATIONS=0
BASENAME=apertium-fr-es
LANG1=es
LANG2=fr
TAGGER=$(LANG1)-tagger-data
PREFIX=$(LANG1)-$(LANG2)
all: $(PREFIX).prob
$(PREFIX).prob: $(BASENAME).$(LANG1).tsx $(TAGGER)/$(LANG1).dic $(TAGGER)/$(LANG1).untagged $(TAGGER)/$(LANG1).tagged $(TAGGER)/$(LANG1).crp
apertium-validate-tagger $(BASENAME).$(LANG1).tsx
apertium-tagger -s $(TAGGER_SUPERVISED_ITERATIONS) \
$(TAGGER)/$(LANG1).dic \
$(TAGGER)/$(LANG1).crp \
$(BASENAME).$(LANG1).tsx \
$(PREFIX).prob \
$(TAGGER)/$(LANG1).tagged \
$(TAGGER)/$(LANG1).untagged;
$(TAGGER)/$(LANG1).dic: $(BASENAME).$(LANG1).dix $(PREFIX).automorf.bin
@echo "Generating $@";
@echo "This may take some time. Please, take a cup of coffee and come back later.";
apertium-validate-dictionary $(BASENAME).$(LANG1).dix
apertium-validate-tagger $(BASENAME).$(LANG1).tsx
lt-expand $(BASENAME).$(LANG1).dix | grep -v "__REGEXP__" | grep -v ":<:" |\
awk 'BEGIN{FS=":>:|:"}{print $$1 ".";}' | apertium-destxt >$(LANG1).dic.expanded
@echo "." >>$(LANG1).dic.expanded
@echo "?" >>$(LANG1).dic.expanded
@echo ";" >>$(LANG1).dic.expanded
@echo ":" >>$(LANG1).dic.expanded
@echo "!" >>$(LANG1).dic.expanded
@echo "42" >>$(LANG1).dic.expanded
@echo "," >>$(LANG1).dic.expanded
@echo "(" >>$(LANG1).dic.expanded
@echo "\\[" >>$(LANG1).dic.expanded
@echo ")" >>$(LANG1).dic.expanded
@echo "\\]" >>$(LANG1).dic.expanded
@echo "¿" >>$(LANG1).dic.expanded
@echo "¡" >>$(LANG1).dic.expanded
lt-proc -a $(PREFIX).automorf.bin <$(LANG1).dic.expanded | \
apertium-filter-ambiguity $(BASENAME).$(LANG1).tsx > $@
rm $(LANG1).dic.expanded;
$(TAGGER)/$(LANG1).crp: $(PREFIX).automorf.bin $(TAGGER)/$(LANG1).crp.txt
apertium-destxt < $(TAGGER)/$(LANG1).crp.txt | lt-proc $(PREFIX).automorf.bin > $(TAGGER)/$(LANG1).crp
$(TAGGER)/$(LANG1).crp.txt:
touch $(TAGGER)/$(LANG1).crp.txt
$(TAGGER)/$(LANG1).tagged:
@echo "Error: File '"$@"' is needed to perform a supervised tagger training" 1>&2
@echo "This file should exist. It is the result of solving the ambiguity from the '"$(TAGGER1)/$(LANG1).tagged.txt"' file" 1>&2
exit 1
$(TAGGER)/$(LANG1).untagged: $(TAGGER)/$(LANG1).tagged.txt $(PREFIX).automorf.bin
cat $(TAGGER)/$(LANG1).tagged.txt | apertium-destxt | lt-proc $(PREFIX).automorf.bin > $@;
clean:
rm -f $(PREFIX).prob
apertium-fr-es-0.9.2~r61322/apertium-fr-es.es-fr.t2x 0000644 0001750 0001750 00000441230 12556573740 021230 0 ustar kartik kartik
apertium-fr-es-0.9.2~r61322/Europarl3.ngrams.fr-es.lrx 0000644 0001750 0001750 00000060630 12556573740 021623 0 ustar kartik kartik
+ 1.5 0.333333333333 9 3 3 alimentaire<*> alimentaire<*> de le<*> alimentario<*> 3
+ 2.0 0.333333333333 6 2 2 alimentaire<*> production<*> alimentaire<*> alimento<*> 2
+ 3.0 0.75 4 3 3 alimentaire<*> industrie<*> alimentaire<*> alimentación<*> 3
+ 2.0 0.4 5 2 2 alimentaire<*> le production<*> alimentaire<*> alimento<*> 2
+ 6.33333333333 0.655172413793 58 38 38 prix le prix de precio 38
+ 2.0 0.4 5 2 2 prix à ce prix precio 2
+ 1.16666666667 0.4375 16 7 7 prix prix à precio 7
+ 1.32352941176 0.441176470588 102 45 45 prix prix de precio 45
+ 6.625 0.576086956522 92 53 53 prix le prix precio 53
+ 2.0 0.5 4 2 2 prix prix à le precio 2
+ 1.5 0.428571428571 7 3 3 prix ce prix precio 3
+ 3.0 0.6 5 3 3 prix de le prix de le<*> precio 3
+ 4.0 0.666666666667 6 4 4 prix que le prix precio 4
+ 3.0 0.75 4 3 3 prix prix de notre<*> precio 3
+ 3.0 0.75 4 3 3 prix de le prix de le precio 3
+ 2.0 0.16 25 15 4 prix de le prix Premio 15
+ 7.5 0.6 25 15 15 prix de le prix precio 15
+ 7.0 0.666666666667 21 14 14 prix un prix precio 14
+ 2.0 0.4 5 2 2 prix prix de le precio 2
+ 3.0 0.75 4 3 3 prix à le prix de le