fp_sqr_comba_24.i 12 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297
  1. /* fp_sqr_comba_24.i
  2. *
  3. * Copyright (C) 2006-2024 wolfSSL Inc.
  4. *
  5. * This file is part of wolfSSL.
  6. *
  7. * wolfSSL is free software; you can redistribute it and/or modify
  8. * it under the terms of the GNU General Public License as published by
  9. * the Free Software Foundation; either version 2 of the License, or
  10. * (at your option) any later version.
  11. *
  12. * wolfSSL is distributed in the hope that it will be useful,
  13. * but WITHOUT ANY WARRANTY; without even the implied warranty of
  14. * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
  15. * GNU General Public License for more details.
  16. *
  17. * You should have received a copy of the GNU General Public License
  18. * along with this program; if not, write to the Free Software
  19. * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1335, USA
  20. */
  21. #ifdef TFM_SQR24
  22. int fp_sqr_comba24(fp_int *A, fp_int *B)
  23. {
  24. fp_digit *a, c0, c1, c2, sc0 = 0, sc1 = 0, sc2 = 0;
  25. #ifdef TFM_ISO
  26. fp_word tt;
  27. #endif
  28. #ifndef WOLFSSL_SMALL_STACK
  29. fp_digit b[48];
  30. #else
  31. fp_digit *b;
  32. #endif
  33. #ifdef WOLFSSL_SMALL_STACK
  34. b = (fp_digit*)XMALLOC(sizeof(fp_digit) * 48, NULL, DYNAMIC_TYPE_TMP_BUFFER);
  35. if (b == NULL)
  36. return FP_MEM;
  37. #endif
  38. a = A->dp;
  39. COMBA_START;
  40. /* clear carries */
  41. CLEAR_CARRY;
  42. /* output 0 */
  43. SQRADD(a[0],a[0]);
  44. COMBA_STORE(b[0]);
  45. /* output 1 */
  46. CARRY_FORWARD;
  47. SQRADD2(a[0], a[1]);
  48. COMBA_STORE(b[1]);
  49. /* output 2 */
  50. CARRY_FORWARD;
  51. SQRADD2(a[0], a[2]); SQRADD(a[1], a[1]);
  52. COMBA_STORE(b[2]);
  53. /* output 3 */
  54. CARRY_FORWARD;
  55. SQRADD2(a[0], a[3]); SQRADD2(a[1], a[2]);
  56. COMBA_STORE(b[3]);
  57. /* output 4 */
  58. CARRY_FORWARD;
  59. SQRADD2(a[0], a[4]); SQRADD2(a[1], a[3]); SQRADD(a[2], a[2]);
  60. COMBA_STORE(b[4]);
  61. /* output 5 */
  62. CARRY_FORWARD;
  63. SQRADDSC(a[0], a[5]); SQRADDAC(a[1], a[4]); SQRADDAC(a[2], a[3]); SQRADDDB;
  64. COMBA_STORE(b[5]);
  65. /* output 6 */
  66. CARRY_FORWARD;
  67. SQRADDSC(a[0], a[6]); SQRADDAC(a[1], a[5]); SQRADDAC(a[2], a[4]); SQRADDDB; SQRADD(a[3], a[3]);
  68. COMBA_STORE(b[6]);
  69. /* output 7 */
  70. CARRY_FORWARD;
  71. SQRADDSC(a[0], a[7]); SQRADDAC(a[1], a[6]); SQRADDAC(a[2], a[5]); SQRADDAC(a[3], a[4]); SQRADDDB;
  72. COMBA_STORE(b[7]);
  73. /* output 8 */
  74. CARRY_FORWARD;
  75. SQRADDSC(a[0], a[8]); SQRADDAC(a[1], a[7]); SQRADDAC(a[2], a[6]); SQRADDAC(a[3], a[5]); SQRADDDB; SQRADD(a[4], a[4]);
  76. COMBA_STORE(b[8]);
  77. /* output 9 */
  78. CARRY_FORWARD;
  79. SQRADDSC(a[0], a[9]); SQRADDAC(a[1], a[8]); SQRADDAC(a[2], a[7]); SQRADDAC(a[3], a[6]); SQRADDAC(a[4], a[5]); SQRADDDB;
  80. COMBA_STORE(b[9]);
  81. /* output 10 */
  82. CARRY_FORWARD;
  83. SQRADDSC(a[0], a[10]); SQRADDAC(a[1], a[9]); SQRADDAC(a[2], a[8]); SQRADDAC(a[3], a[7]); SQRADDAC(a[4], a[6]); SQRADDDB; SQRADD(a[5], a[5]);
  84. COMBA_STORE(b[10]);
  85. /* output 11 */
  86. CARRY_FORWARD;
  87. SQRADDSC(a[0], a[11]); SQRADDAC(a[1], a[10]); SQRADDAC(a[2], a[9]); SQRADDAC(a[3], a[8]); SQRADDAC(a[4], a[7]); SQRADDAC(a[5], a[6]); SQRADDDB;
  88. COMBA_STORE(b[11]);
  89. /* output 12 */
  90. CARRY_FORWARD;
  91. SQRADDSC(a[0], a[12]); SQRADDAC(a[1], a[11]); SQRADDAC(a[2], a[10]); SQRADDAC(a[3], a[9]); SQRADDAC(a[4], a[8]); SQRADDAC(a[5], a[7]); SQRADDDB; SQRADD(a[6], a[6]);
  92. COMBA_STORE(b[12]);
  93. /* output 13 */
  94. CARRY_FORWARD;
  95. SQRADDSC(a[0], a[13]); SQRADDAC(a[1], a[12]); SQRADDAC(a[2], a[11]); SQRADDAC(a[3], a[10]); SQRADDAC(a[4], a[9]); SQRADDAC(a[5], a[8]); SQRADDAC(a[6], a[7]); SQRADDDB;
  96. COMBA_STORE(b[13]);
  97. /* output 14 */
  98. CARRY_FORWARD;
  99. SQRADDSC(a[0], a[14]); SQRADDAC(a[1], a[13]); SQRADDAC(a[2], a[12]); SQRADDAC(a[3], a[11]); SQRADDAC(a[4], a[10]); SQRADDAC(a[5], a[9]); SQRADDAC(a[6], a[8]); SQRADDDB; SQRADD(a[7], a[7]);
  100. COMBA_STORE(b[14]);
  101. /* output 15 */
  102. CARRY_FORWARD;
  103. SQRADDSC(a[0], a[15]); SQRADDAC(a[1], a[14]); SQRADDAC(a[2], a[13]); SQRADDAC(a[3], a[12]); SQRADDAC(a[4], a[11]); SQRADDAC(a[5], a[10]); SQRADDAC(a[6], a[9]); SQRADDAC(a[7], a[8]); SQRADDDB;
  104. COMBA_STORE(b[15]);
  105. /* output 16 */
  106. CARRY_FORWARD;
  107. SQRADDSC(a[0], a[16]); SQRADDAC(a[1], a[15]); SQRADDAC(a[2], a[14]); SQRADDAC(a[3], a[13]); SQRADDAC(a[4], a[12]); SQRADDAC(a[5], a[11]); SQRADDAC(a[6], a[10]); SQRADDAC(a[7], a[9]); SQRADDDB; SQRADD(a[8], a[8]);
  108. COMBA_STORE(b[16]);
  109. /* output 17 */
  110. CARRY_FORWARD;
  111. SQRADDSC(a[0], a[17]); SQRADDAC(a[1], a[16]); SQRADDAC(a[2], a[15]); SQRADDAC(a[3], a[14]); SQRADDAC(a[4], a[13]); SQRADDAC(a[5], a[12]); SQRADDAC(a[6], a[11]); SQRADDAC(a[7], a[10]); SQRADDAC(a[8], a[9]); SQRADDDB;
  112. COMBA_STORE(b[17]);
  113. /* output 18 */
  114. CARRY_FORWARD;
  115. SQRADDSC(a[0], a[18]); SQRADDAC(a[1], a[17]); SQRADDAC(a[2], a[16]); SQRADDAC(a[3], a[15]); SQRADDAC(a[4], a[14]); SQRADDAC(a[5], a[13]); SQRADDAC(a[6], a[12]); SQRADDAC(a[7], a[11]); SQRADDAC(a[8], a[10]); SQRADDDB; SQRADD(a[9], a[9]);
  116. COMBA_STORE(b[18]);
  117. /* output 19 */
  118. CARRY_FORWARD;
  119. SQRADDSC(a[0], a[19]); SQRADDAC(a[1], a[18]); SQRADDAC(a[2], a[17]); SQRADDAC(a[3], a[16]); SQRADDAC(a[4], a[15]); SQRADDAC(a[5], a[14]); SQRADDAC(a[6], a[13]); SQRADDAC(a[7], a[12]); SQRADDAC(a[8], a[11]); SQRADDAC(a[9], a[10]); SQRADDDB;
  120. COMBA_STORE(b[19]);
  121. /* output 20 */
  122. CARRY_FORWARD;
  123. SQRADDSC(a[0], a[20]); SQRADDAC(a[1], a[19]); SQRADDAC(a[2], a[18]); SQRADDAC(a[3], a[17]); SQRADDAC(a[4], a[16]); SQRADDAC(a[5], a[15]); SQRADDAC(a[6], a[14]); SQRADDAC(a[7], a[13]); SQRADDAC(a[8], a[12]); SQRADDAC(a[9], a[11]); SQRADDDB; SQRADD(a[10], a[10]);
  124. COMBA_STORE(b[20]);
  125. /* output 21 */
  126. CARRY_FORWARD;
  127. SQRADDSC(a[0], a[21]); SQRADDAC(a[1], a[20]); SQRADDAC(a[2], a[19]); SQRADDAC(a[3], a[18]); SQRADDAC(a[4], a[17]); SQRADDAC(a[5], a[16]); SQRADDAC(a[6], a[15]); SQRADDAC(a[7], a[14]); SQRADDAC(a[8], a[13]); SQRADDAC(a[9], a[12]); SQRADDAC(a[10], a[11]); SQRADDDB;
  128. COMBA_STORE(b[21]);
  129. /* output 22 */
  130. CARRY_FORWARD;
  131. SQRADDSC(a[0], a[22]); SQRADDAC(a[1], a[21]); SQRADDAC(a[2], a[20]); SQRADDAC(a[3], a[19]); SQRADDAC(a[4], a[18]); SQRADDAC(a[5], a[17]); SQRADDAC(a[6], a[16]); SQRADDAC(a[7], a[15]); SQRADDAC(a[8], a[14]); SQRADDAC(a[9], a[13]); SQRADDAC(a[10], a[12]); SQRADDDB; SQRADD(a[11], a[11]);
  132. COMBA_STORE(b[22]);
  133. /* output 23 */
  134. CARRY_FORWARD;
  135. SQRADDSC(a[0], a[23]); SQRADDAC(a[1], a[22]); SQRADDAC(a[2], a[21]); SQRADDAC(a[3], a[20]); SQRADDAC(a[4], a[19]); SQRADDAC(a[5], a[18]); SQRADDAC(a[6], a[17]); SQRADDAC(a[7], a[16]); SQRADDAC(a[8], a[15]); SQRADDAC(a[9], a[14]); SQRADDAC(a[10], a[13]); SQRADDAC(a[11], a[12]); SQRADDDB;
  136. COMBA_STORE(b[23]);
  137. /* output 24 */
  138. CARRY_FORWARD;
  139. SQRADDSC(a[1], a[23]); SQRADDAC(a[2], a[22]); SQRADDAC(a[3], a[21]); SQRADDAC(a[4], a[20]); SQRADDAC(a[5], a[19]); SQRADDAC(a[6], a[18]); SQRADDAC(a[7], a[17]); SQRADDAC(a[8], a[16]); SQRADDAC(a[9], a[15]); SQRADDAC(a[10], a[14]); SQRADDAC(a[11], a[13]); SQRADDDB; SQRADD(a[12], a[12]);
  140. COMBA_STORE(b[24]);
  141. /* output 25 */
  142. CARRY_FORWARD;
  143. SQRADDSC(a[2], a[23]); SQRADDAC(a[3], a[22]); SQRADDAC(a[4], a[21]); SQRADDAC(a[5], a[20]); SQRADDAC(a[6], a[19]); SQRADDAC(a[7], a[18]); SQRADDAC(a[8], a[17]); SQRADDAC(a[9], a[16]); SQRADDAC(a[10], a[15]); SQRADDAC(a[11], a[14]); SQRADDAC(a[12], a[13]); SQRADDDB;
  144. COMBA_STORE(b[25]);
  145. /* output 26 */
  146. CARRY_FORWARD;
  147. SQRADDSC(a[3], a[23]); SQRADDAC(a[4], a[22]); SQRADDAC(a[5], a[21]); SQRADDAC(a[6], a[20]); SQRADDAC(a[7], a[19]); SQRADDAC(a[8], a[18]); SQRADDAC(a[9], a[17]); SQRADDAC(a[10], a[16]); SQRADDAC(a[11], a[15]); SQRADDAC(a[12], a[14]); SQRADDDB; SQRADD(a[13], a[13]);
  148. COMBA_STORE(b[26]);
  149. /* output 27 */
  150. CARRY_FORWARD;
  151. SQRADDSC(a[4], a[23]); SQRADDAC(a[5], a[22]); SQRADDAC(a[6], a[21]); SQRADDAC(a[7], a[20]); SQRADDAC(a[8], a[19]); SQRADDAC(a[9], a[18]); SQRADDAC(a[10], a[17]); SQRADDAC(a[11], a[16]); SQRADDAC(a[12], a[15]); SQRADDAC(a[13], a[14]); SQRADDDB;
  152. COMBA_STORE(b[27]);
  153. /* output 28 */
  154. CARRY_FORWARD;
  155. SQRADDSC(a[5], a[23]); SQRADDAC(a[6], a[22]); SQRADDAC(a[7], a[21]); SQRADDAC(a[8], a[20]); SQRADDAC(a[9], a[19]); SQRADDAC(a[10], a[18]); SQRADDAC(a[11], a[17]); SQRADDAC(a[12], a[16]); SQRADDAC(a[13], a[15]); SQRADDDB; SQRADD(a[14], a[14]);
  156. COMBA_STORE(b[28]);
  157. /* output 29 */
  158. CARRY_FORWARD;
  159. SQRADDSC(a[6], a[23]); SQRADDAC(a[7], a[22]); SQRADDAC(a[8], a[21]); SQRADDAC(a[9], a[20]); SQRADDAC(a[10], a[19]); SQRADDAC(a[11], a[18]); SQRADDAC(a[12], a[17]); SQRADDAC(a[13], a[16]); SQRADDAC(a[14], a[15]); SQRADDDB;
  160. COMBA_STORE(b[29]);
  161. /* output 30 */
  162. CARRY_FORWARD;
  163. SQRADDSC(a[7], a[23]); SQRADDAC(a[8], a[22]); SQRADDAC(a[9], a[21]); SQRADDAC(a[10], a[20]); SQRADDAC(a[11], a[19]); SQRADDAC(a[12], a[18]); SQRADDAC(a[13], a[17]); SQRADDAC(a[14], a[16]); SQRADDDB; SQRADD(a[15], a[15]);
  164. COMBA_STORE(b[30]);
  165. /* output 31 */
  166. CARRY_FORWARD;
  167. SQRADDSC(a[8], a[23]); SQRADDAC(a[9], a[22]); SQRADDAC(a[10], a[21]); SQRADDAC(a[11], a[20]); SQRADDAC(a[12], a[19]); SQRADDAC(a[13], a[18]); SQRADDAC(a[14], a[17]); SQRADDAC(a[15], a[16]); SQRADDDB;
  168. COMBA_STORE(b[31]);
  169. /* output 32 */
  170. CARRY_FORWARD;
  171. SQRADDSC(a[9], a[23]); SQRADDAC(a[10], a[22]); SQRADDAC(a[11], a[21]); SQRADDAC(a[12], a[20]); SQRADDAC(a[13], a[19]); SQRADDAC(a[14], a[18]); SQRADDAC(a[15], a[17]); SQRADDDB; SQRADD(a[16], a[16]);
  172. COMBA_STORE(b[32]);
  173. /* output 33 */
  174. CARRY_FORWARD;
  175. SQRADDSC(a[10], a[23]); SQRADDAC(a[11], a[22]); SQRADDAC(a[12], a[21]); SQRADDAC(a[13], a[20]); SQRADDAC(a[14], a[19]); SQRADDAC(a[15], a[18]); SQRADDAC(a[16], a[17]); SQRADDDB;
  176. COMBA_STORE(b[33]);
  177. /* output 34 */
  178. CARRY_FORWARD;
  179. SQRADDSC(a[11], a[23]); SQRADDAC(a[12], a[22]); SQRADDAC(a[13], a[21]); SQRADDAC(a[14], a[20]); SQRADDAC(a[15], a[19]); SQRADDAC(a[16], a[18]); SQRADDDB; SQRADD(a[17], a[17]);
  180. COMBA_STORE(b[34]);
  181. /* output 35 */
  182. CARRY_FORWARD;
  183. SQRADDSC(a[12], a[23]); SQRADDAC(a[13], a[22]); SQRADDAC(a[14], a[21]); SQRADDAC(a[15], a[20]); SQRADDAC(a[16], a[19]); SQRADDAC(a[17], a[18]); SQRADDDB;
  184. COMBA_STORE(b[35]);
  185. /* output 36 */
  186. CARRY_FORWARD;
  187. SQRADDSC(a[13], a[23]); SQRADDAC(a[14], a[22]); SQRADDAC(a[15], a[21]); SQRADDAC(a[16], a[20]); SQRADDAC(a[17], a[19]); SQRADDDB; SQRADD(a[18], a[18]);
  188. COMBA_STORE(b[36]);
  189. /* output 37 */
  190. CARRY_FORWARD;
  191. SQRADDSC(a[14], a[23]); SQRADDAC(a[15], a[22]); SQRADDAC(a[16], a[21]); SQRADDAC(a[17], a[20]); SQRADDAC(a[18], a[19]); SQRADDDB;
  192. COMBA_STORE(b[37]);
  193. /* output 38 */
  194. CARRY_FORWARD;
  195. SQRADDSC(a[15], a[23]); SQRADDAC(a[16], a[22]); SQRADDAC(a[17], a[21]); SQRADDAC(a[18], a[20]); SQRADDDB; SQRADD(a[19], a[19]);
  196. COMBA_STORE(b[38]);
  197. /* output 39 */
  198. CARRY_FORWARD;
  199. SQRADDSC(a[16], a[23]); SQRADDAC(a[17], a[22]); SQRADDAC(a[18], a[21]); SQRADDAC(a[19], a[20]); SQRADDDB;
  200. COMBA_STORE(b[39]);
  201. /* output 40 */
  202. CARRY_FORWARD;
  203. SQRADDSC(a[17], a[23]); SQRADDAC(a[18], a[22]); SQRADDAC(a[19], a[21]); SQRADDDB; SQRADD(a[20], a[20]);
  204. COMBA_STORE(b[40]);
  205. /* output 41 */
  206. CARRY_FORWARD;
  207. SQRADDSC(a[18], a[23]); SQRADDAC(a[19], a[22]); SQRADDAC(a[20], a[21]); SQRADDDB;
  208. COMBA_STORE(b[41]);
  209. /* output 42 */
  210. CARRY_FORWARD;
  211. SQRADD2(a[19], a[23]); SQRADD2(a[20], a[22]); SQRADD(a[21], a[21]);
  212. COMBA_STORE(b[42]);
  213. /* output 43 */
  214. CARRY_FORWARD;
  215. SQRADD2(a[20], a[23]); SQRADD2(a[21], a[22]);
  216. COMBA_STORE(b[43]);
  217. /* output 44 */
  218. CARRY_FORWARD;
  219. SQRADD2(a[21], a[23]); SQRADD(a[22], a[22]);
  220. COMBA_STORE(b[44]);
  221. /* output 45 */
  222. CARRY_FORWARD;
  223. SQRADD2(a[22], a[23]);
  224. COMBA_STORE(b[45]);
  225. /* output 46 */
  226. CARRY_FORWARD;
  227. SQRADD(a[23], a[23]);
  228. COMBA_STORE(b[46]);
  229. COMBA_STORE2(b[47]);
  230. COMBA_FINI;
  231. B->used = 48;
  232. B->sign = FP_ZPOS;
  233. XMEMCPY(B->dp, b, 48 * sizeof(fp_digit));
  234. fp_clamp(B);
  235. #ifdef WOLFSSL_SMALL_STACK
  236. XFREE(b, NULL, DYNAMIC_TYPE_TMP_BUFFER);
  237. #endif
  238. return FP_OKAY;
  239. }
  240. #endif