Tudalen 1 o 1

Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Llun 01 Chw 2010 6:38 pm
gan Duw
Yn dilyn cynhadledd Hacio'r Iaith, cefais wybodaeth yn son am fynnu trefn gywir ar restrau enwau/geiriau yn y Gymraeg. Dwi wedi chwilio a chwilio am beiriant a fyddai'n trefnu geiriau yn ol ein (g?)wyddor. Yn y diwedd, rhoddais lan a chynhyrchais god fy hun. Hoffwn ofyn i 'tecis' ac 'arbenigwyr iaith' i brofi'r dudalen os oes cwpwl o funudau sbar gennych.

Y dudalen - modd defnyddio rhestr (trefnu hyd at 10 gair) a/neu baragraff (cyfrifo nifer y nodau a llythrennau).

Mae sawl cwestiwn gennyf:

1. Mae BYIG yn son llawer am drefnu 'ng' a 'rh', yng nghanol geiriau, ond nid llawer parthed y gweddill (ch, dd...). Ydy geiriau sy'n cynnwys 'ch' yn y canol yn dod ar ol 'cy'? e.e. 'cachadur' yn dilyn 'cacynen'.

2. A oes unrhyw ddatrysiad arall yn bodoli? Datrysiad trefn uniongyrchol o MySQL byddai'n ddefnyddiol. Dwi heb weld 'collation' sy'n caniatau hyn.

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Llun 01 Chw 2010 7:07 pm
gan Hogyn o Rachub
Wel, fedrai'm helpu o gwbl efo'r pethau cyfrifiadurol, ond o ran yr iaith mi fyddai geiriau sy'n cynnwys y 'ch' yn y canol yn dod ar ol y geiriau 'cy' (h.y. 'cachu' ar ol 'cacynen') - mae hynny'r un fath ar gyfer pob un o'r llythrennau dwbl.

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Llun 01 Chw 2010 7:21 pm
gan Kez
Mae'r wyddor yn mynd a b c ch d dd ac ati, felly mae cacynen yn dod o flaen cachu ac mae rhydu yn dod o flaen rhydd.

Mae geiriau ag ng yn bygars i ffindo yn y geiriadur -maen nhw'n dod ar ol g eg agor cyn angau. Wi wastod yn meddwl dyla fe ddod ar ol m ac felly aml cyn angau, ond nid fel 'ny mae.

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Llun 01 Chw 2010 7:39 pm
gan Duw
Dioch HR - dyna beth o'n i'n meddwl - neis i gael cadarhad.

Kez a ddywedodd:Mae'r wyddor yn mynd a b c ch d dd ac ati, felly mae cacynen yn dod o flaen cachu ac mae rhydu yn dod o flaen rhydd.

Mae geiriau ag ng yn bygars i ffindo yn y geiriadur -maen nhw'n dod ar ol g eg agor cyn angau. Wi wastod yn meddwl dyla fe ddod ar ol m ac felly aml cyn angau, ond nid fel 'ny mae.


Do - sylwes i ar hyn. Mae canllawiau BYIG yn awgrymu ein bod yn cyfri 'ng' fel y llythyren 'ng' er bod rhai yn gyfuniad o 'n' + 'g'. Dwi'n meddwl byddai'n rhy anodd i godio am hyn oherwydd byddai'n rhaid cael rhestr o'r cwbwl lot (geiriadur ar-lein). Diolch Kez.

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Maw 02 Chw 2010 4:06 pm
gan Duw
Sori pawb - cwestiwn arall:

Dwi wastad wedi derbyn llafariaid gydag acenion yn gydradd i lafariaid heb acen, er a oes trefn arbennig iddynt os ydy'r llythrennau sy'n eu cympasu'n unfath? E.e. hyn a hŷn (OK - mae'r geiriadur yn dweud y drefn honno) Ond beth am y drefn 'mysg yr acenion eu hunain?

e.e. à, â, á, ä

Wylle bo hwn yn gwestiwn di-fater oherwydd nid yr achos yn codi?

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Maw 16 Chw 2010 2:32 pm
gan Hogyn o Rachub
Yn gyffredinol maen nhw'n gydradd, ond efallai gyda rhai geiriau (fel y ddau nodaist) byddai'n syniad rhoi'r gair â acen ar ôl y llall (fel 'tan' cyn 'tân', 'ton' cyn 'tôn') ac ati. Ond i fod yn onest prin y deui ar eu traws nhw.

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Mer 17 Chw 2010 8:41 pm
gan Shadrach
[a á à â ä b c {ch} d {dd} e é è ê ë f {ff} g-i í ì î ï l {ll} m n {ng} o ó ò ô ö p {ph} r {rh} s t {th} u ú ù û ü w ẃ ẁ ŵ ẅ y ý ỳ ŷ ÿ]
http://unicode.org/repos/cldr-tmp/trunk/diff/summary/cy.html?hide

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Iau 18 Chw 2010 10:11 am
gan Duw
Aha!
Diolch Shad - dolen yn ddefnyddiol iawn hefyd.

//Golygu

er - dwi ddim yn meddwl dylai {ng} ddod ar ôl 'n'.

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Llun 22 Chw 2010 9:06 pm
gan Shadrach
Ar ol ychydig bach mwy o ymchwil rwy'n deall taw'r llythrennau Cymraeg yn nhrefn goladu ddiofyn Unicode ( DUCET ) sydd ar y tudalen.
Mae'r rheolau ychwanegol sydd eu angen i gael trefn goladu gywir ar gyfer y Gymraeg i'w gweld yma
http://unicode.org/repos/cldr/trunk/common/collation/cy.xml . Yn fras mae'n pennu beth mae rhaid gwneud gyda'r llythrennau dwbl.
Yr unig gwahaniaeth i'r rhestr wreiddiol yw lleoliad 'ng'.

Mae modd chwarae gyda'r drefn goladu yma http://demo.icu-project.org/icu-bin/locexp?_=cy&d_=en&x=col - er mwyn cael y dref gywir ar gyfer y Gymraeg mae rhaid ychwanegu'r rheolau isod:
Cod: Dewis popeth
&c<ch<Ch<CH
&d<dd<Dd<DD
&f<ff<Ff<FF
&g<ng<Ng<NG
&l<ll<Ll<LL
&p<ph<Ph<PH
&r<rh<Rh<RH
&t<th<Th<TH


Yn ddelfrydol ni fyddai datblygwyr unigol yn gorfod ysgrifennu meddalwedd i drefnu geiriau - dim ond defnyddio modiwlau safonol i wneud y gwaith.
Mae un i gael ar gyfer Perl o'r enw Unicode::Collate sy'n trefnu geiriau yn ol DUCET ( mae'n cynnwys y ffeil http://unicode.org/Public/UCA/4.0.0/allkeys-4.0.0.txt ) ond sy'n caniatau nodi lleoleiddiad.

Er enghraifft dyma rhaglen Perl sy'n defnyddio'r modiwl uchod - y rheolau ychwanegol ar gyfer y Gymraeg yw'r bloc 'ENTRY' ( dylai fod mewn ffeil ar wahan )
Cod: Dewis popeth
use Unicode::Collate;
use strict;
use warnings;

my $entry = <<'ENTRY'; # DUCET v4.0.0 (allkeys-4.0.0.txt)
0063 0068 ; [.1007.0020.0002.0063] # ch
0043 0068 ; [.1007.0020.0007.0043] # Ch
0043 0048 ; [.1007.0020.0008.0043] # CH
0064 0064 ; [.101C.0020.0002.0064] # dd
0044 0064 ; [.101C.0020.0007.0044] # Dd
0044 0044 ; [.101C.0020.0008.0044] # DD
0066 0066 ; [.1064.0020.0002.0066] # ff
0046 0066 ; [.1064.0020.0007.0046] # Ff
0046 0046 ; [.1064.0020.0008.0046] # FF
006E 0067 ; [.107B.0020.0002.006E] # ng
004E 0067 ; [.107B.0020.0002.006E] # Ng
004E 0047 ; [.107B.0020.0002.006E] # NG
006C 006C ; [.10FA.0020.0002.006C] # ll
004C 006C ; [.10FA.0020.0007.004C] # Ll
004C 004C ; [.10FA.0020.0008.004C] # LL
0070 0068 ; [.1165.0020.0002.0070] # ph
0050 0068 ; [.1165.0020.0007.0050] # Ph
0050 0048 ; [.1165.0020.0008.0050] # PH
0072 0068 ; [.1196.0020.0002.0072] # rh
0052 0068 ; [.1196.0020.0007.0052] # Rh
0052 0048 ; [.1196.0020.0008.0052] # RH
0074 0068 ; [.11DE.0020.0002.0074] # th
0054 0068 ; [.11DE.0020.0007.0054] # Th
0054 0048 ; [.11DE.0020.0008.0054] # TH
ENTRY
 
my $mewnbwn = <<'MEWNBWN';
ch d dd â e é è á rh rhydu rhydd s tôn tŷ tynn à
ê a ë f ff g sêl ng i í tân ì î ï tôn l lori ll m ä arch
agor b c car o cachu n ó defnydd angau cacynen ò ô ö p ph
ú r th u ù û ü w y ý ÿ tŵr
MEWNBWN

my @anhrefnedig = split(' ',$mewnbwn);

my $coladu = Unicode::Collate->new( entry=>$entry );

my @trefnedig = $coladu->sort(@anhrefnedig);

if ( open ( my $fh, '>', 'allbwn.txt' ) ) {
        print $fh join(qq(\n),@trefnedig);
   close( $fh );
}


A dyma'r allbwn
Cod: Dewis popeth
a
á
à
â
ä
agor
angau
arch
b
c
cacynen
cachu
car
ch
d
defnydd
dd
e
é
è
ê
ë
f
ff
g
ng
i
í
ì
î
ï
l
lori
ll
m
n
o
ó
ò
ô
ö
p
ph
r
rh
rhydu
rhydd
s
sêl
tân
ton
tôn
twr
twrist
ty
tynn
th
u
ú
ù
û
ü
w
y
ý
ÿ


Copio a gludo ar Windows sy'n gyfrifol am golli to bach yr 'w' a'r 'y'

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

PostioPostiwyd: Gwe 05 Maw 2010 12:05 am
gan Duw
AHA! Da iawn Shad - arbed lot o waith.