ó <±h÷vãóô•SSKrSSKJr SSKJr SSKJr SSKJrJ r \ R"\5r\"5(aSSK r SrS"S\\S \S S\\S\S \44SjjrS"S\\S \S S\\S\S \44SjjrS"S\\S \S S\\S\S \44SjjrS#S\S S S\\S\S \44SjjrS#S\S S S\\S\S \44SjjrS#S\S S S\\S\S \44Sjjr\\\\\\S.rS$S\S\S\S\\S\\4 SjjrS#S\S\\4SjjrS#S\S\\4SjjrS#S\S\\4SjjrS#S\S\\4SjjrS#S\S\\4Sjjr S#S\S\\4S jjr!\\\\\ \!S.r"S#S\S\\4S!jjr#g)%éN©Úwraps)ÚOptionalé)ÚPretrainedConfig)Úis_torch_availableÚloggingcóD^^^•SmSm[T5UUU4Sj5nU$)aD Decorator function to update the RoPE parameters in the forward pass, if the model is using a dynamic RoPE (i.e. a RoPE implementation that may recompute its frequencies in the forward pass). Args: rope_forward (Callable): The forward pass of the RoPE implementation. Returns: The decorated forward pass. cóê•[R"U5S-n[URS5(aURRnOURR nX4:”aR[US5(d%UR URX$S-S9uUlnURSURSS9 gURRU5Ul URSURSS9 g) zbLongrope uses long factor if sequence is larger than original pretraining length, short otherwise.rÚ original_max_position_embeddingsÚ long_inv_freq©Úseq_lenÚinv_freqF©Ú persistentN)ÚtorchÚmaxÚhasattrÚconfigrÚmax_position_embeddingsÚrope_init_fnr Úregister_bufferÚoriginal_inv_freqÚto)ÚselfÚposition_idsÚdevicerrÚ_s ÚX/var/www/html/shao/venv/lib/python3.13/site-packages/transformers/modeling_rope_utils.pyÚlongrope_frequency_updateÚ6dynamic_rope_update..longrope_frequency_update+sÚ€ä—)’)˜LÓ)¨AÑ-ˆÜ4—;‘;Ð B×CÑCØ/3¯{©{×/[Ñ/[Ñ,à/3¯{©{×/RÑ/RÐ,ØÓ5Ü˜4 ×1Ñ1Ø(,×(9Ñ(9Ø—K‘K ÐTUÑ1Uð):ð)Ñ%Ô" Að × Ñ ¨T×-?Ñ-?ÈEÐ ÒRð&*×%;Ñ%;×%>Ñ%>¸vÓ%FˆDÔ"Ø× Ñ ¨T×-CÑ-CÐPUÐ ÒVócó²•[R"U5S-nX0R:”a8URURX#S9uo@lUR SUSS9 X0lX0R:ahURUR:”aMURRU5UlUR SURSS9 URUlggg)zó dynamic RoPE layers should recompute `inv_freq` in the following situations: 1 - growing beyond the cached sequence length (allow scaling) 2 - the current sequence length is in the original scale (avoid losing precision with small sequences) rrrFrN) rrÚmax_seq_len_cachedrrÚattention_scalingrÚoriginal_max_seq_lenrr)rrrrrs r Údynamic_frequency_updateÚ5dynamic_rope_update..dynamic_frequency_update>sÊ€ô—)’)˜LÓ)¨AÑ-ˆØ×,Ñ,Ó,Ø/3×/@Ñ/@ÀÇÁÈfÐ/@Ð/fÑ,ˆHÔ,Ø× Ñ ¨XÀ%Ð ÑHØ&-Ô#à×.Ñ.Ó.°4×3JÑ3JÈT×MfÑMfÓ3fð&*×%;Ñ%;×%>Ñ%>¸vÓ%FˆDÔ"Ø× Ñ ¨T×-CÑ-CÐPUÐ ÑVØ&*×&?Ñ&?ˆDÕ#ð4gÐ.r#cóœ>•SUR;aT"XURS9 O!URS:XaT"XURS9 T"XU5$)NÚdynamic)rÚlongrope)Ú rope_typer)rÚxrr(r!Úrope_forwards €€€r ÚwrapperÚ$dynamic_rope_update..wrapperQsDø€à˜Ÿ™Ó&Ù$ TÀÇÁÓIØ ^‰^˜zÓ )Ù% dÀÇÁÒJÙ˜D \Ó2Ð2r#r)r/r0r(r!s` @@r Údynamic_rope_updater2s/ú€òWò&@ô&ˆ<Óö3óð3ð€Nr#rrztorch.devicerÚreturnztorch.Tensorc ój•URn[US5(aUROSn[USS5=(d URUR -n[ XT-5nSnSU[R"SUS[RS9RU[RS9U---nX‡4$) aH Computes the inverse frequencies according to the original RoPE implementation Args: config ([`~transformers.PretrainedConfig`]): The model configuration. device (`torch.device`): The device to use for initialization of the inverse frequencies. seq_len (`int`, *optional*): The current sequence length. Unused for this type of RoPE. Returns: Tuple of (`torch.Tensor`, `float`), containing the inverse frequencies for the RoPE embeddings and the post-processing scaling factor applied to the computed cos/sin (unused in this type of RoPE). Úpartial_rotary_factorçð?Úhead_dimNré©Údtype©rr:)Ú rope_thetarr5ÚgetattrÚhidden_sizeÚnum_attention_headsÚintrÚarangeÚint64rÚfloat) rrrÚbaser5r7ÚdimÚattention_factorrs r Ú _compute_default_rope_parametersrG\s€ð$×Ñ€DÜr?r@rrJÚ isinstancerÚTensorÚmaximumÚtensorr:rrrArBrrC)rrrrDr5r7rErrIrFrs r Ú_compute_dynamic_ntk_parametersrR˜s@€ð&×Ñ€DÜÑ>À6ÈAÁ:ÑNÐTWÐabÑ[bÑTcÑdÑd€DØdœuŸ|š|¨A¨s°A¼U¿[¹[ÑI×LÑLÐTZÔbg×bmÑbmÐLÐnÐqtÑtÑuÑv€HØÐ%Ð%r#cój^•URn[US5(aUROSn[USURUR -5n[ XT-5nURSnURRS5nURRS5n URRS5n SUR;aURSnURU-nOURnSS jnUc1U (a"U (a[U"Xy5U"Xz5-5nOU"U5nURRS5=(d Sn URRS 5=(d S nSmU4SjnSnU[R"SUS5RU[RS9U--nSU-nSUU--nURRSS5nU"XÞXcUU5unnS U"UUUS-5RU[RS9- nUS U- -UU--nUU4$)a] Computes the inverse frequencies with NTK scaling. Please refer to the [original paper](https://huggingface.co/papers/2309.00071) Args: config ([`~transformers.PretrainedConfig`]): The model configuration. device (`torch.device`): The device to use for initialization of the inverse frequencies. seq_len (`int`, *optional*): The current sequence length. Unused for this type of RoPE. Returns: Tuple of (`torch.Tensor`, `float`), containing the inverse frequencies for the RoPE embeddings and the post-processing scaling factor applied to the computed cos/sin. r5r6r7rIrFÚmscaleÚmscale_all_dimrrcóN•US::agSU-[R"U5-S-$)Nrr6gš™™™™™¹?)ÚmathÚlog)ÚscalerTs r Ú get_mscaleÚ,_compute_yarn_parameters..get_mscaleés(€ØA‹:ØØV‰|œdŸhšh u›oÑ-°Ñ3Ð3r#Ú beta_fasté Ú beta_slowcó”•U[R"X0S-[R--5-S[R"U5--$)zPInverse dimension formula to find the dimension based on the number of rotationsr8)rWrXÚpi)Ú num_rotationsrErDrs r Úfind_correction_dimÚ5_compute_yarn_parameters..find_correction_dimûs@€à”d—h’hÐ6È!Ñ:KÌdÏgÉgÑ:UÑVÓWÑWÐ\]Ô`d×`hÒ`hÐimÓ`nÑ\nÑoÐor#cóÂ>•T"XX45nT"XX45nU(a,[R"U5n[R"U5n[US5[ XrS- 54$)z.Find dimension range bounds based on rotationsrr)rWÚfloorÚceilrÚmin) Úlow_rotÚhigh_rotrErDrÚtruncateÚlowÚhighrbs €r Úfind_correction_rangeÚ7_compute_yarn_parameters..find_correction_rangeÿsRø€á! '°ÓNˆÙ" 8°$ÓPˆÞÜŸ š 3›#Ü—9’9˜T“?ˆDÜ3˜‹{œC ¨A¡gÓ.Ð.Ð.r#có •X:XaUS- n[R"U[RS9U- X- -n[R"USS5nU$)Ngü©ñÒMbP?r9rr)rrAÚfloat32Úclamp)rgrrEÚlinear_funcÚ ramp_funcs r Úlinear_ramp_factorÚ4_compute_yarn_parameters..linear_ramp_factorsH€Ø‹:Ø5‰LˆCä—|’| C¬u¯}©}Ñ=ÀÑCÈÉ ÑRˆÜ—K’K ¨Q°Ó2ˆ ØÐr#rr8r;rjT)r)r<rr5r=r>r?r@rJÚgetrrCrrAr)rrrrDr5r7rErIrFrTrUrrZr\r^rmrtÚ pos_freqsÚinv_freq_extrapolationÚinv_freq_interpolationrjrkrlÚinv_freq_extrapolation_factorrrbs @r Ú_compute_yarn_parametersr{ÅsIø€ð$×Ñ€DÜ€Nð *¨V×-@Ñ-@Ó@Ø+1×+>Ñ+>Ð?aÑ+bÐ(Ø×/Ñ/Ð2RÑR‰à+1×+IÑ+IÐ(ô4ðÑÞ–nÜ$¡Z°Ó%?Á*ÈVÓBdÑ%dÓeÑá)¨&Ó1Ðð×#Ñ#×'Ñ'¨Ó4×:¸€IØ×#Ñ#×'Ñ'¨Ó4×9¸€Iòpõ/òðœŸš a¨¨aÓ0×3Ñ3¸6ÌÏÉÐ3ÐUÐX[Ñ[Ñ\€IØ 9™_ÐØ F¨YÑ$6Ñ7Ðà×"Ñ"×&Ñ& z°4Ó8€HÙ% i¸CÐGgÐiqÓrI€Cˆð%&Ñ(:¸3ÀÀcÈQÁhÓ(O×(RÑ(RÐZ`Ôhm×hsÑhsÐ(RÐ(tÑ$tÐ!à !Ð&CÑ"CÑDØ Ð#@Ñ @ñ Að ðÐ%Ð%Ð%r#cóº•URn[US5(aUROSn[USURUR -5n[ XT-5nURSnURSnURRS5n URRS5n [US5(a&URnURUR-n OURnU cMU S::aSn OD[R"S [R"U 5[R"U5--5n U(a*X+:”a%[R"U[R US 9nO$[R"U[R US 9n[R""SUS[R$US 9R'5U-n SXÃU ---nXê4$) aJ Computes the inverse frequencies with LongRoPE scaling. Please refer to the [original implementation](https://github.com/microsoft/LongRoPE) Args: config ([`~transformers.PretrainedConfig`]): The model configuration. device (`torch.device`): The device to use for initialization of the inverse frequencies. seq_len (`int`, *optional*): The current sequence length. Returns: Tuple of (`torch.Tensor`, `float`), containing the inverse frequencies for the RoPE embeddings and the post-processing scaling factor applied to the computed cos/sin. r5r6r7Úlong_factorÚshort_factorrIrFrrrMrr8)r<rr5r=r>r?r@rJrvrrrWÚsqrtrXrrQrprArBrC)rrrrDr5r7rEr}r~rIrFrÚext_factorsÚinv_freq_shapers r Ú_compute_longrope_parametersr‚"sž€ð$×Ñ€DÜÐØ×)Ñ)Ð*LÑM€Oà&Ñ8ÐØ'Ñ:Ðà”$—'‘'‰k˜HÑ$€Gô—[’[ Ñ!;¸XÑ=NÐPXÓY€Nà$Ñ.°Ñ@ÐEUÑEgÑh€MØ˜]Ñ*¨nÑ<¸vÑEÈ ÑHfÑfÐØÑ2Ð3¸Ñ8RÐ6SÑS€NÜ—[’[ ÀNÓS€NàÐ+Ð+r#)ÚdefaultÚlinearr+Úyarnr,Úllama3r-Ú received_keysÚ required_keysÚ optional_keysÚignore_keyscóè•SU;aUS1-nURS5 UbX-nX!- nU(a[SUSU35eUbX- U- nOX- nU(a[RSUSU35 gg)zYCompare the received keys in `config.rope_scaling` against the expected and optional keysÚtyper-Nz9Missing required keys in `rope_scaling` for 'rope_type'='z': z5Unrecognized keys in `rope_scaling` for 'rope_type'=')ÚaddÚKeyErrorÚloggerÚwarning)r-r”r•r–r—Úmissing_keysÚunused_keyss r Ú_check_received_keysr ŽsŸ€ðÓØ˜&˜Ñ!ˆ Ø×Ñ˜+Ô&ðÑØÑ$ˆ à Ñ0€LÞÜÐRÐS\ÐR]Ð]`ÐamÐ`nÐoÓpÐpàÑ Ø#Ñ3°mÑC‰à#Ñ3ˆÞÜ‰ÐNÈyÈkÐY\Ð]hÐ\iÐjÕkðr#có¬•URnURSURSS55nS1n[UR55n[ X5XAS9 g)Nr-r™©r—)rJrvÚsetÚkeysr )rr—rJr-r•r”s r Ú!_validate_default_rope_parametersr¥«sP€Ø×&Ñ&€LØ× Ñ ¨l×.>Ñ.>¸vÀtÓ.LÓM€IØ M€MÜ˜×)Ñ)Ó+Ó,€MÜ˜°=ÓZr#có&•URnURSURSS55nSS1n[UR55n[ X5XAS9 USnUb[U[5(aUS:a[RSU35 gg)Nr-r™rIr¢r6ú8`rope_scaling`'s factor field must be a float >= 1, got © rJrvr£r¤r rNrCrœr)rr—rJr-r•r”rIs r Ú(_validate_linear_scaling_rope_parametersr©³s€Ø×&Ñ&€LØ× Ñ ¨l×.>Ñ.>¸vÀtÓ.LÓM€IØ (Ð+€MÜ˜×)Ñ)Ó+Ó,€MÜ˜°=ÒZà ˜(Ñ #€FØ ~œZ¨´×6Ñ6¸&À3»,Ü‰ÐQÐRXÐQYÐZÕ[ð;Gr#có.•URnURSURSS55nSS1nS1n[UR55n[ X6XEUS9 USnUb[U[5(aUS:a[RSU35 gg)Nr-r™rIrr¢r6r§r¨)rr—rJr-r•r–r”rIs r Ú)_validate_dynamic_scaling_rope_parametersr«¿s›€Ø×&Ñ&€LØ× Ñ ¨l×.>Ñ.>¸vÀtÓ.LÓM€IØ (Ð+€Mà7Ð8€MÜ˜×)Ñ)Ó+Ó,€MÜ˜°=Ð]hÒià ˜(Ñ #€FØ ~œZ¨´×6Ñ6¸&À3»,Ü‰ÐQÐRXÐQYÐZÕ[ð;Gr#có*•URnURSURSS55nSS1n1Skn[UR55n[ X6XEUS9 USnUb[U[5(aUS:a[RSU35 URS5nUb3[U[5(aUS :a[RS U35 URS5n U b-[U [5(d[RSU 35 URS 5n U b-[U [5(d[RSU 35 U =(d SU =(d S:a[RSU SU S35 gg)Nr-r™rI>rTrjr\r^rUrFrr¢r6r§rFrúL`rope_scaling`'s attention_factor field must be a float greater than 0, got r\z6`rope_scaling`'s beta_fast field must be a float, got r^z6`rope_scaling`'s beta_slow field must be a float, got r]rzO`rope_scaling`'s beta_fast field must be greater than beta_slow, got beta_fast=z( (defaults to 32 if None) and beta_slow=z (defaults to 1 if None)r¨)rr—rJr-r•r–r”rIrFr\r^s r Ú_validate_yarn_parametersr®ÍsŠ€Ø×&Ñ&€LØ× Ñ ¨l×.>Ñ.>¸vÀtÓ.LÓM€IØ (Ð+€Mò€Mô˜×)Ñ)Ó+Ó,€MÜ˜°=Ð]hÒià ˜(Ñ #€FØ ~œZ¨´×6Ñ6¸&À3»,Ü‰ÐQÐRXÐQYÐZÔ[à#×'Ñ'Ð(:Ó;ÐØÑ#¬ZÐ8HÌ%×-PÑ-PÐTdÐghÓThÜ‰ØZÐ[kÐZlÐmô ð× Ñ Ó-€IØÑ¤Z° ¼5×%AÑ%AÜ‰ÐOÐPYÈ{Ð[Ô\Ø× Ñ Ó-€IØÑ¤Z° ¼5×%AÑ%AÜ‰ÐOÐPYÈ{Ð[Ô\àR˜IŸN¨Ó+Ü‰Ø]Ð^gÐ]hði6Ø6?°[Ð@Xð Zõ ð,r#có*•URnURSURSS55n1Skn1Skn[UR55n[ X6XEUS9 [US5(aUROSn[USURUR-5n[X‡-5n URS 5n [U [5(d/[S U 55(a[RSU 35 [!U 5U S-:wa'[RS U S-S[!U 535 URS5n[U[5(d/[SU55(a[RSU35 [!U5U S-:wa'[RSU S-S[!U535 [US5(a[R#S5 gURS5nUc[RS5 O3[U[$5(aUS:a[RSU35 URS5n U b5[U [$5(aU S:a[RSU 35 ggg)Nr-r™>r-r}r~>rIrFrr¢r5r6r7r~c3óL# •UHn[U[[45v• M g7f©N©rNr@rC©Ú.0r.s r Ú Ú0_validate_longrope_parameters..s!é€Ð1dÑWcÐRS´*¸QÄÄeÀ×2MÐ2MÒWcùó‚"$zC`rope_scaling`'s short_factor field must be a list of numbers, got r8z5`rope_scaling`'s short_factor field must have length z, got r}c3óL# •UHn[U[[45v• M g7fr±r²r³s r rµr¶s!é€Ð0bÑVaÐQR´¸AÄÄU¸|×1LÐ1LÒVaùr·zB`rope_scaling`'s long_factor field must be a list of numbers, got z4`rope_scaling`'s long_factor field must have length raYThis model has set a `original_max_position_embeddings` field, to be used together with `max_position_embeddings` to determine a scaling factor. Please set the `factor` field of `rope_scaling`with this ratio instead -- we recommend the use of this field over `original_max_position_embeddings`, as it is compatible with most model architectures.rIz1Missing required keys in `rope_scaling`: 'factor'r§rFgr)rJrvr£r¤r rr5r=r>r?r@rNÚlistÚallrœrÚlenÚwarning_oncerC)rr—rJr-r•r–r”r5r7rEr~r}rIrFs r Ú_validate_longrope_parametersr½ôsZ€Ø×&Ñ&€LØ× Ñ ¨l×.>Ñ.>¸vÀtÓ.LÓM€IÚ@€MâV€MÜ˜×)Ñ)Ó+Ó,€MÜ˜°=Ð]hÒiäÜN‰NÐNÕOÜ˜F¤E×*Ñ*¨f°s«lÜN‰NÐUÐV\ÐU]Ð^Ô_à'×+Ñ+Ð,>Ó?ÐØÑ'ÜÐ.´×6Ñ6Ð:JÈSÓ:PÜ—‘ØbÐcsÐbtÐuõð;Qð(r#có•URnURSURSS55n1Skn[UR55n[ X5XAS9 USnUb[U[5(aUS:a[RSU35 USnUS nUb[U[5(d[RS U35 Ub[U[5(d[RSU35 X‡::a[RSUS U35 USn U b[U [5(d[RSU 35 XR:¼a&[RSU SUR35 gg)Nr-r™>rIr-r„r…rr¢rIr6r§r„r…z<`rope_scaling`'s low_freq_factor field must be a float, got z=`rope_scaling`'s high_freq_factor field must be a float, got zc`rope_scaling`'s high_freq_factor field must be greater than low_freq_factor, got high_freq_factor=z and low_freq_factor=rzP`rope_scaling`'s original_max_position_embeddings field must be an integer, got zg`rope_scaling`'s original_max_position_embeddings field must be less than max_position_embeddings, got z and max_position_embeddings=)rJrvr£r¤r rNrCrœrr@r) rr—rJr-r•r”rIr„r…rs r Ú_validate_llama3_parametersr¿&s€Ø×&Ñ&€LØ× Ñ ¨l×.>Ñ.>¸vÀtÓ.LÓM€IÚv€MÜ˜×)Ñ)Ó+Ó,€MÜ˜°=ÒZà ˜(Ñ #€FØ ~œZ¨´×6Ñ6¸&À3»,Ü‰ÐQÐRXÐQYÐZÔ[à"Ð#4Ñ5€OØ#Ð$6Ñ7ÐØÑ¤j°Ä%×&HÑ&HÜ‰ÐUÐVeÐUfÐgÔhØÑ¤zÐ2BÄE×'JÑ'JÜ‰ÐVÐWgÐVhÐiÔjØÓ*Ü‰ØqØÐ Ð 5°oÐ5Fð Hô ð (4Ð4VÑ'WÐ$Ø'Ñ/´zÐBbÔdg×7hÑ7hÜ‰Ø^Ø/Ð0ð 2ô ð(×+IÑ+IÓIÜ‰ØuØ/Ð0Ð0MÈf×NlÑNlÐMmð oõ ðJr#cóÚ•[USS5nUcgURSURSS55n[RU5nUbU"XS9 g[R SUS35 g) zG Validate the RoPE config arguments, given a `PretrainedConfig` object rJNr-r™rr¢zTMissing validation function mapping in `ROPE_VALIDATION_FUNCTIONS` for 'rope_type'='Ú')r=rvÚROPE_VALIDATION_FUNCTIONSrœr)rr—rJr-Ú validation_fns r Úrope_config_validationrÄUsu€ô˜6 >°4Ó8€LØÑØð× Ñ ¨l×.>Ñ.>¸vÀyÓ.QÓR€IÜ-×1Ñ1°)Ó<€MØÑ ÙfÓ6ä‰ØbÐclÐbmÐmnÐoõ r#)NNNr±)NN)$rWÚ functoolsrÚtypingrÚconfiguration_utilsrÚutilsrr Ú get_loggerÚ__name__rœrr2r@ÚtuplerCrGrKrRr{r‚rÚROPE_INIT_FUNCTIONSÚstrr£r r¥r©r«r®r½r¿rÂrÄ©r#r ÚrÏsðóÝÝå1ß.ð × Ò ˜HÓ %€ñ×ÑÛò;ð~*.Ø'+Ø!ñ&ØÐ%Ñ&ð&à^Ñ$ð&ðc‰]ð&ðˆ>˜5Ð Ñ!õ &ð>*.Ø'+Ø!ñ&ØÐ%Ñ&ð&à^Ñ$ð&ðc‰]ð&ðˆ>˜5Ð Ñ!õ &ð>*.Ø'+Ø!ñ*&ØÐ%Ñ&ð*&à^Ñ$ð*&ðc‰]ð*&ðˆ>˜5Ð Ñ!õ *&ð\PTñZ&ØðZ&Ø&4ðZ&Ø?GÈ¹}ðZ&à ˆ>˜5Ð Ñ!õZ&ð|PTñ3&Øð3&Ø&4ð3&Ø?GÈ¹}ð3&à ˆ>˜5Ð Ñ!õ3&ðnPTñ&,Øð&,Ø&4ð&,Ø?GÈ¹}ð&,à ˆ>˜5Ð Ñ!õ&,ðZ0Ø5Ø.Ø$Ø,Ø(ñ Ðð$(Ø!%ñlØðlàðlððlð˜C‘=ð lð ˜#‘õlñ:[Ð.>ð[ÈXÐVYÉ]õ[ñ \Ð5Eð \ÐT\Ð]`ÑTaõ \ñ\Ð6Fð\ÐU]Ð^aÑUbõ\ñ$ Ð&6ð$ ÀXÈcÁ]õ$ ñN/Ð*:ð/ÈÐRUÉõ/ñd! Ð(8ð! ÀxÐPSÁ}õ! ðL1Ø6Ø8Ø%Ø-Ø)ñ Ðñ Ð#3ð À(È3Á-ö r#