fp_sqr_comba_12.i 3.5 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135
  1. #ifdef TFM_SQR12
  2. void fp_sqr_comba12(fp_int *A, fp_int *B)
  3. {
  4. fp_digit *a, b[24], c0, c1, c2, sc0, sc1, sc2;
  5. a = A->dp;
  6. COMBA_START;
  7. /* clear carries */
  8. CLEAR_CARRY;
  9. /* output 0 */
  10. SQRADD(a[0],a[0]);
  11. COMBA_STORE(b[0]);
  12. /* output 1 */
  13. CARRY_FORWARD;
  14. SQRADD2(a[0], a[1]);
  15. COMBA_STORE(b[1]);
  16. /* output 2 */
  17. CARRY_FORWARD;
  18. SQRADD2(a[0], a[2]); SQRADD(a[1], a[1]);
  19. COMBA_STORE(b[2]);
  20. /* output 3 */
  21. CARRY_FORWARD;
  22. SQRADD2(a[0], a[3]); SQRADD2(a[1], a[2]);
  23. COMBA_STORE(b[3]);
  24. /* output 4 */
  25. CARRY_FORWARD;
  26. SQRADD2(a[0], a[4]); SQRADD2(a[1], a[3]); SQRADD(a[2], a[2]);
  27. COMBA_STORE(b[4]);
  28. /* output 5 */
  29. CARRY_FORWARD;
  30. SQRADDSC(a[0], a[5]); SQRADDAC(a[1], a[4]); SQRADDAC(a[2], a[3]); SQRADDDB;
  31. COMBA_STORE(b[5]);
  32. /* output 6 */
  33. CARRY_FORWARD;
  34. SQRADDSC(a[0], a[6]); SQRADDAC(a[1], a[5]); SQRADDAC(a[2], a[4]); SQRADDDB; SQRADD(a[3], a[3]);
  35. COMBA_STORE(b[6]);
  36. /* output 7 */
  37. CARRY_FORWARD;
  38. SQRADDSC(a[0], a[7]); SQRADDAC(a[1], a[6]); SQRADDAC(a[2], a[5]); SQRADDAC(a[3], a[4]); SQRADDDB;
  39. COMBA_STORE(b[7]);
  40. /* output 8 */
  41. CARRY_FORWARD;
  42. SQRADDSC(a[0], a[8]); SQRADDAC(a[1], a[7]); SQRADDAC(a[2], a[6]); SQRADDAC(a[3], a[5]); SQRADDDB; SQRADD(a[4], a[4]);
  43. COMBA_STORE(b[8]);
  44. /* output 9 */
  45. CARRY_FORWARD;
  46. SQRADDSC(a[0], a[9]); SQRADDAC(a[1], a[8]); SQRADDAC(a[2], a[7]); SQRADDAC(a[3], a[6]); SQRADDAC(a[4], a[5]); SQRADDDB;
  47. COMBA_STORE(b[9]);
  48. /* output 10 */
  49. CARRY_FORWARD;
  50. SQRADDSC(a[0], a[10]); SQRADDAC(a[1], a[9]); SQRADDAC(a[2], a[8]); SQRADDAC(a[3], a[7]); SQRADDAC(a[4], a[6]); SQRADDDB; SQRADD(a[5], a[5]);
  51. COMBA_STORE(b[10]);
  52. /* output 11 */
  53. CARRY_FORWARD;
  54. SQRADDSC(a[0], a[11]); SQRADDAC(a[1], a[10]); SQRADDAC(a[2], a[9]); SQRADDAC(a[3], a[8]); SQRADDAC(a[4], a[7]); SQRADDAC(a[5], a[6]); SQRADDDB;
  55. COMBA_STORE(b[11]);
  56. /* output 12 */
  57. CARRY_FORWARD;
  58. SQRADDSC(a[1], a[11]); SQRADDAC(a[2], a[10]); SQRADDAC(a[3], a[9]); SQRADDAC(a[4], a[8]); SQRADDAC(a[5], a[7]); SQRADDDB; SQRADD(a[6], a[6]);
  59. COMBA_STORE(b[12]);
  60. /* output 13 */
  61. CARRY_FORWARD;
  62. SQRADDSC(a[2], a[11]); SQRADDAC(a[3], a[10]); SQRADDAC(a[4], a[9]); SQRADDAC(a[5], a[8]); SQRADDAC(a[6], a[7]); SQRADDDB;
  63. COMBA_STORE(b[13]);
  64. /* output 14 */
  65. CARRY_FORWARD;
  66. SQRADDSC(a[3], a[11]); SQRADDAC(a[4], a[10]); SQRADDAC(a[5], a[9]); SQRADDAC(a[6], a[8]); SQRADDDB; SQRADD(a[7], a[7]);
  67. COMBA_STORE(b[14]);
  68. /* output 15 */
  69. CARRY_FORWARD;
  70. SQRADDSC(a[4], a[11]); SQRADDAC(a[5], a[10]); SQRADDAC(a[6], a[9]); SQRADDAC(a[7], a[8]); SQRADDDB;
  71. COMBA_STORE(b[15]);
  72. /* output 16 */
  73. CARRY_FORWARD;
  74. SQRADDSC(a[5], a[11]); SQRADDAC(a[6], a[10]); SQRADDAC(a[7], a[9]); SQRADDDB; SQRADD(a[8], a[8]);
  75. COMBA_STORE(b[16]);
  76. /* output 17 */
  77. CARRY_FORWARD;
  78. SQRADDSC(a[6], a[11]); SQRADDAC(a[7], a[10]); SQRADDAC(a[8], a[9]); SQRADDDB;
  79. COMBA_STORE(b[17]);
  80. /* output 18 */
  81. CARRY_FORWARD;
  82. SQRADD2(a[7], a[11]); SQRADD2(a[8], a[10]); SQRADD(a[9], a[9]);
  83. COMBA_STORE(b[18]);
  84. /* output 19 */
  85. CARRY_FORWARD;
  86. SQRADD2(a[8], a[11]); SQRADD2(a[9], a[10]);
  87. COMBA_STORE(b[19]);
  88. /* output 20 */
  89. CARRY_FORWARD;
  90. SQRADD2(a[9], a[11]); SQRADD(a[10], a[10]);
  91. COMBA_STORE(b[20]);
  92. /* output 21 */
  93. CARRY_FORWARD;
  94. SQRADD2(a[10], a[11]);
  95. COMBA_STORE(b[21]);
  96. /* output 22 */
  97. CARRY_FORWARD;
  98. SQRADD(a[11], a[11]);
  99. COMBA_STORE(b[22]);
  100. COMBA_STORE2(b[23]);
  101. COMBA_FINI;
  102. B->used = 24;
  103. B->sign = FP_ZPOS;
  104. memcpy(B->dp, b, 24 * sizeof(fp_digit));
  105. fp_clamp(B);
  106. }
  107. #endif