ANEXA 2 1 Frecvența relativă a literelor, digramelor, trigramelor și 4-gramelor în limba română NEAGOE MIHAI CĂTĂLIN DLMFS/CRIFST Datele statistice cuprind: Număr cuvinte = 25 947 Caractere fără spații (litere) = 119 903 Caractere cu spații (litere + spații) = 145920 Frecvență litere Litere Fracvențe relative Litere Fracvențe relative Litere Fracvențe relative Litere Fracvențe relative Litere Fracvențe relative E 11.60002 C 5.589215 P 3.058837 Â 0.966037 W 0.007573 I 10.22754 Ă 4.406072 Ș 1.570231 G 0.870107 Y 0.005049 A 10.10637 S 4.291629 F 1.331246 Z 0.657208 Q 0.000841 R 6.577132 L 4.243664 Î 1.311892 H 0.386247 Σ = 100 N 6.454273 O 3.897809 V 1.242048 J 0.184288 U 6.020903 D 3.498098 Ț 1.08553 X 0.111919 T 5.864385 M 3.437511 B 0.983709 K 0.012622 Frecvență digrame Di- grame Fracvențe relative Di- grame Fracvențe relative Di- grame Fracvențe relative Di- grame Fracvențe relative Di- grame Fracvențe relative Di- grame Fracvențe relative RE 2.205165 PO 0.379453 ȚE 0.15829 UȚ 0.060713 LF 0.014094 OO 0.002168 DE 1.891845 SU 0.376201 BĂ 0.15829 ĂD 0.060713 OE 0.014094 PP 0.002168 AR 1.747653 NA 0.375117 ÎM 0.14744 UF 0.058544 ȘĂ 0.014094 GM 0.002168 IN 1.697782 NC 0.372948 RM 0.14636 ÎL 0.058544 NN 0.014094 WW 0.002168 EA 1.582862 SP 0.372948 ZE 0.14419 ĂU 0.05746 PȚ 0.01301 GT 0.002168 TE 1.565515 ȘT 0.367527 MN 0.14094 IB 0.056376 XA 0.01301 HS 0.002168 RI 1.389883 PĂ 0.365359 EB 0.14094 VÂ 0.055292 LG 0.01301 SK 0.002168 ÎN 1.359526 IS 0.362107 GĂ 0.13986 UD 0.055292 RP 0.01301 HR 0.002168 ȘI 1.279299 G 0.346929 GI 0.13877 HA 0.054208 TD 0.01301 VN 0.002168 AT 1.261953 NO 0.343676 EG 0.13877 ĂN 0.053123 VL 0.01301 CV 0.002168 CU 1.247859 AȚ 0.342592 GR 0.1366 ÂM 0.053123 ÎȚ 0.011926 WI 0.002168 UL 1.191483 MĂ 0.341508 SO 0.13552 GO 0.052039 IH 0.011926 CȘ 0.002168 UN 1.170884 CÂ 0.340424 CT 0.13335 IF 0.052039 RH 0.011926 VS 0.002168 CE 1.139444 VI 0.336087 OD 0.13227 XP 0.052039 ĂB 0.011926 IX 0.002168 LE 1.13077 FE 0.333919 AG 0.13118 SF 0.052039 ZN 0.011926 ÂH 0.002168 SE 1.129686 MP 0.319825 IȚ 0.1301 ÎȘ 0.047703 ĂJ 0.011926 TN 0.002168 CA 1.126434 EM 0.317656 EX 0.12793 BL 0.046619 XE 0.010842 TT 0.002168 TR 1.104751 AP 0.315488 GA 0.12685 LB 0.045534 HN 0.010842 TZ 0.002168 ER 1.078731 ET 0.311152 ID 0.12251 RȚ 0.043366 AH 0.010842 ZS 0.002168 NT 1.077647 ZI 0.306815 AB 0.12034 ÂS 0.043366 KI 0.010842 AA 0.002168 NE 0.998504 CH 0.305731 OB 0.12034 VU 0.042282 ÂZ 0.009757 UH 0.002168 ST 0.964895 NĂ 0.30031 DĂ 0.12034 ȘU 0.042282 DM 0.009757 OY 0.002168 OR 0.963811 SI 0.297058 GU 0.11817 ÂI 0.042282 JL 0.009757 DN 0.002168 CĂ 0.95839 NȚ 0.297058 AF 0.11492 ȚU 0.041198 BD 0.009757 AK 0.001084 1 Această cercetare statistică a fost făcută în cadrul lucrării ”INFORMAȚIE ȘI SEMNIFICAȚIE ÎN COMUNICAREA DIN SISTEME REALE”