Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Bydysawd yr uwchnerdiaid

Cymedrolwr: dafydd

Rheolau’r seiat
Cyfle i drafod unrhywbeth sy'n ymwneud â Dylunio, Technoleg a'r We. Problem cyfrifiadurol? Bydd aelodau'r maes yn falch o gynnig cymorth. Pwyswch yma i ddarllen canllawiau cyffredinol maes-e.

Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Duw » Llun 01 Chw 2010 6:38 pm

Yn dilyn cynhadledd Hacio'r Iaith, cefais wybodaeth yn son am fynnu trefn gywir ar restrau enwau/geiriau yn y Gymraeg. Dwi wedi chwilio a chwilio am beiriant a fyddai'n trefnu geiriau yn ol ein (g?)wyddor. Yn y diwedd, rhoddais lan a chynhyrchais god fy hun. Hoffwn ofyn i 'tecis' ac 'arbenigwyr iaith' i brofi'r dudalen os oes cwpwl o funudau sbar gennych.

Y dudalen - modd defnyddio rhestr (trefnu hyd at 10 gair) a/neu baragraff (cyfrifo nifer y nodau a llythrennau).

Mae sawl cwestiwn gennyf:

1. Mae BYIG yn son llawer am drefnu 'ng' a 'rh', yng nghanol geiriau, ond nid llawer parthed y gweddill (ch, dd...). Ydy geiriau sy'n cynnwys 'ch' yn y canol yn dod ar ol 'cy'? e.e. 'cachadur' yn dilyn 'cacynen'.

2. A oes unrhyw ddatrysiad arall yn bodoli? Datrysiad trefn uniongyrchol o MySQL byddai'n ddefnyddiol. Dwi heb weld 'collation' sy'n caniatau hyn.
Rhithffurf defnyddiwr
Duw
Gweinyddwr
Gweinyddwr
 
Negeseuon: 1263
Ymunwyd: Mer 16 Ion 2008 6:39 pm
Lleoliad: fanyn a wynco

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Hogyn o Rachub » Llun 01 Chw 2010 7:07 pm

Wel, fedrai'm helpu o gwbl efo'r pethau cyfrifiadurol, ond o ran yr iaith mi fyddai geiriau sy'n cynnwys y 'ch' yn y canol yn dod ar ol y geiriau 'cy' (h.y. 'cachu' ar ol 'cacynen') - mae hynny'r un fath ar gyfer pob un o'r llythrennau dwbl.
"Be gymrwch chi Wiliam, ai salad ta beth?"
"Oes rhaid i chi ofyn? Wel, tatws trwy crwyn!"

Y Rachub Rydd Gymraeg
Rhithffurf defnyddiwr
Hogyn o Rachub
Defnyddiwr Aur
Defnyddiwr Aur
 
Negeseuon: 4939
Ymunwyd: Gwe 25 Hyd 2002 7:59 pm
Lleoliad: Caerdydd a Rachub

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Kez » Llun 01 Chw 2010 7:21 pm

Mae'r wyddor yn mynd a b c ch d dd ac ati, felly mae cacynen yn dod o flaen cachu ac mae rhydu yn dod o flaen rhydd.

Mae geiriau ag ng yn bygars i ffindo yn y geiriadur -maen nhw'n dod ar ol g eg agor cyn angau. Wi wastod yn meddwl dyla fe ddod ar ol m ac felly aml cyn angau, ond nid fel 'ny mae.
Rhithffurf defnyddiwr
Kez
Defnyddiwr Arian
Defnyddiwr Arian
 
Negeseuon: 661
Ymunwyd: Llun 30 Gor 2007 1:39 pm
Lleoliad: Battersea

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Duw » Llun 01 Chw 2010 7:39 pm

Dioch HR - dyna beth o'n i'n meddwl - neis i gael cadarhad.

Kez a ddywedodd:Mae'r wyddor yn mynd a b c ch d dd ac ati, felly mae cacynen yn dod o flaen cachu ac mae rhydu yn dod o flaen rhydd.

Mae geiriau ag ng yn bygars i ffindo yn y geiriadur -maen nhw'n dod ar ol g eg agor cyn angau. Wi wastod yn meddwl dyla fe ddod ar ol m ac felly aml cyn angau, ond nid fel 'ny mae.


Do - sylwes i ar hyn. Mae canllawiau BYIG yn awgrymu ein bod yn cyfri 'ng' fel y llythyren 'ng' er bod rhai yn gyfuniad o 'n' + 'g'. Dwi'n meddwl byddai'n rhy anodd i godio am hyn oherwydd byddai'n rhaid cael rhestr o'r cwbwl lot (geiriadur ar-lein). Diolch Kez.
Rhithffurf defnyddiwr
Duw
Gweinyddwr
Gweinyddwr
 
Negeseuon: 1263
Ymunwyd: Mer 16 Ion 2008 6:39 pm
Lleoliad: fanyn a wynco

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Duw » Maw 02 Chw 2010 4:06 pm

Sori pawb - cwestiwn arall:

Dwi wastad wedi derbyn llafariaid gydag acenion yn gydradd i lafariaid heb acen, er a oes trefn arbennig iddynt os ydy'r llythrennau sy'n eu cympasu'n unfath? E.e. hyn a hŷn (OK - mae'r geiriadur yn dweud y drefn honno) Ond beth am y drefn 'mysg yr acenion eu hunain?

e.e. à, â, á, ä

Wylle bo hwn yn gwestiwn di-fater oherwydd nid yr achos yn codi?
Rhithffurf defnyddiwr
Duw
Gweinyddwr
Gweinyddwr
 
Negeseuon: 1263
Ymunwyd: Mer 16 Ion 2008 6:39 pm
Lleoliad: fanyn a wynco

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Hogyn o Rachub » Maw 16 Chw 2010 2:32 pm

Yn gyffredinol maen nhw'n gydradd, ond efallai gyda rhai geiriau (fel y ddau nodaist) byddai'n syniad rhoi'r gair â acen ar ôl y llall (fel 'tan' cyn 'tân', 'ton' cyn 'tôn') ac ati. Ond i fod yn onest prin y deui ar eu traws nhw.
"Be gymrwch chi Wiliam, ai salad ta beth?"
"Oes rhaid i chi ofyn? Wel, tatws trwy crwyn!"

Y Rachub Rydd Gymraeg
Rhithffurf defnyddiwr
Hogyn o Rachub
Defnyddiwr Aur
Defnyddiwr Aur
 
Negeseuon: 4939
Ymunwyd: Gwe 25 Hyd 2002 7:59 pm
Lleoliad: Caerdydd a Rachub

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Shadrach » Mer 17 Chw 2010 8:41 pm

[a á à â ä b c {ch} d {dd} e é è ê ë f {ff} g-i í ì î ï l {ll} m n {ng} o ó ò ô ö p {ph} r {rh} s t {th} u ú ù û ü w ẃ ẁ ŵ ẅ y ý ỳ ŷ ÿ]
http://unicode.org/repos/cldr-tmp/trunk/diff/summary/cy.html?hide
Shadrach
Defnyddiwr
Defnyddiwr
 
Negeseuon: 7
Ymunwyd: Iau 27 Awst 2009 8:28 pm

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Duw » Iau 18 Chw 2010 10:11 am

Aha!
Diolch Shad - dolen yn ddefnyddiol iawn hefyd.

//Golygu

er - dwi ddim yn meddwl dylai {ng} ddod ar ôl 'n'.
Rhithffurf defnyddiwr
Duw
Gweinyddwr
Gweinyddwr
 
Negeseuon: 1263
Ymunwyd: Mer 16 Ion 2008 6:39 pm
Lleoliad: fanyn a wynco

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Shadrach » Llun 22 Chw 2010 9:06 pm

Ar ol ychydig bach mwy o ymchwil rwy'n deall taw'r llythrennau Cymraeg yn nhrefn goladu ddiofyn Unicode ( DUCET ) sydd ar y tudalen.
Mae'r rheolau ychwanegol sydd eu angen i gael trefn goladu gywir ar gyfer y Gymraeg i'w gweld yma
http://unicode.org/repos/cldr/trunk/common/collation/cy.xml . Yn fras mae'n pennu beth mae rhaid gwneud gyda'r llythrennau dwbl.
Yr unig gwahaniaeth i'r rhestr wreiddiol yw lleoliad 'ng'.

Mae modd chwarae gyda'r drefn goladu yma http://demo.icu-project.org/icu-bin/locexp?_=cy&d_=en&x=col - er mwyn cael y dref gywir ar gyfer y Gymraeg mae rhaid ychwanegu'r rheolau isod:
Cod: Dewis popeth
&c<ch<Ch<CH
&d<dd<Dd<DD
&f<ff<Ff<FF
&g<ng<Ng<NG
&l<ll<Ll<LL
&p<ph<Ph<PH
&r<rh<Rh<RH
&t<th<Th<TH


Yn ddelfrydol ni fyddai datblygwyr unigol yn gorfod ysgrifennu meddalwedd i drefnu geiriau - dim ond defnyddio modiwlau safonol i wneud y gwaith.
Mae un i gael ar gyfer Perl o'r enw Unicode::Collate sy'n trefnu geiriau yn ol DUCET ( mae'n cynnwys y ffeil http://unicode.org/Public/UCA/4.0.0/allkeys-4.0.0.txt ) ond sy'n caniatau nodi lleoleiddiad.

Er enghraifft dyma rhaglen Perl sy'n defnyddio'r modiwl uchod - y rheolau ychwanegol ar gyfer y Gymraeg yw'r bloc 'ENTRY' ( dylai fod mewn ffeil ar wahan )
Cod: Dewis popeth
use Unicode::Collate;
use strict;
use warnings;

my $entry = <<'ENTRY'; # DUCET v4.0.0 (allkeys-4.0.0.txt)
0063 0068 ; [.1007.0020.0002.0063] # ch
0043 0068 ; [.1007.0020.0007.0043] # Ch
0043 0048 ; [.1007.0020.0008.0043] # CH
0064 0064 ; [.101C.0020.0002.0064] # dd
0044 0064 ; [.101C.0020.0007.0044] # Dd
0044 0044 ; [.101C.0020.0008.0044] # DD
0066 0066 ; [.1064.0020.0002.0066] # ff
0046 0066 ; [.1064.0020.0007.0046] # Ff
0046 0046 ; [.1064.0020.0008.0046] # FF
006E 0067 ; [.107B.0020.0002.006E] # ng
004E 0067 ; [.107B.0020.0002.006E] # Ng
004E 0047 ; [.107B.0020.0002.006E] # NG
006C 006C ; [.10FA.0020.0002.006C] # ll
004C 006C ; [.10FA.0020.0007.004C] # Ll
004C 004C ; [.10FA.0020.0008.004C] # LL
0070 0068 ; [.1165.0020.0002.0070] # ph
0050 0068 ; [.1165.0020.0007.0050] # Ph
0050 0048 ; [.1165.0020.0008.0050] # PH
0072 0068 ; [.1196.0020.0002.0072] # rh
0052 0068 ; [.1196.0020.0007.0052] # Rh
0052 0048 ; [.1196.0020.0008.0052] # RH
0074 0068 ; [.11DE.0020.0002.0074] # th
0054 0068 ; [.11DE.0020.0007.0054] # Th
0054 0048 ; [.11DE.0020.0008.0054] # TH
ENTRY
 
my $mewnbwn = <<'MEWNBWN';
ch d dd â e é è á rh rhydu rhydd s tôn tŷ tynn à
ê a ë f ff g sêl ng i í tân ì î ï tôn l lori ll m ä arch
agor b c car o cachu n ó defnydd angau cacynen ò ô ö p ph
ú r th u ù û ü w y ý ÿ tŵr
MEWNBWN

my @anhrefnedig = split(' ',$mewnbwn);

my $coladu = Unicode::Collate->new( entry=>$entry );

my @trefnedig = $coladu->sort(@anhrefnedig);

if ( open ( my $fh, '>', 'allbwn.txt' ) ) {
        print $fh join(qq(\n),@trefnedig);
   close( $fh );
}


A dyma'r allbwn
Cod: Dewis popeth
a
á
à
â
ä
agor
angau
arch
b
c
cacynen
cachu
car
ch
d
defnydd
dd
e
é
è
ê
ë
f
ff
g
ng
i
í
ì
î
ï
l
lori
ll
m
n
o
ó
ò
ô
ö
p
ph
r
rh
rhydu
rhydd
s
sêl
tân
ton
tôn
twr
twrist
ty
tynn
th
u
ú
ù
û
ü
w
y
ý
ÿ


Copio a gludo ar Windows sy'n gyfrifol am golli to bach yr 'w' a'r 'y'
Shadrach
Defnyddiwr
Defnyddiwr
 
Negeseuon: 7
Ymunwyd: Iau 27 Awst 2009 8:28 pm

Re: Trefnu Geiriau - Galw Tecis ac Arbenigwyr Iaith

Postiogan Duw » Gwe 05 Maw 2010 12:05 am

AHA! Da iawn Shad - arbed lot o waith.
Rhithffurf defnyddiwr
Duw
Gweinyddwr
Gweinyddwr
 
Negeseuon: 1263
Ymunwyd: Mer 16 Ion 2008 6:39 pm
Lleoliad: fanyn a wynco


Dychwelyd i Dylunio, Technoleg a'r We

Pwy sydd ar-lein

Defnyddwyr sy’n pori’r seiat hon: Dim defnyddwyr cofrestredig a 2 gwestai

cron